Nhà cái khuyến mãi thành viên mới 88k. Trong Phần 1 của loạt bài này, chúng tôi đã thảo luận về thực tế là hầu hết người chơi có xu hướng không lừa đủ.
Vì vậy, hành động cá cược của họ thường thể hiện sự “trung thực” (value hand) hơn là “không trung thực” (bluffing hand). Điều này khiến tôi đưa ra quy tắc trung thực.
Quy tắc trung thực: Nhìn chung, cộng đồng poker lừa bịp ít hơn nhiều so với mức họ nên làm.
Mặt khác, trí tuệ nhân tạo (AI) như Libratus gần đây đã đánh bại một số người chơi poker không giới hạn hàng đầu thế giới. Hôm nay chúng ta sẽ nhìn lại một ván bài điên rồ mà Libratus đã chơi và xem chúng ta có thể học được gì từ chiến lược của anh ấy.Nhà cái khuyến mãi thành viên mới 88k.
Trọng tâm của chiến lược Libratus là khả năng thu hẹp khoảng cách giữa value bet và bluff, khiến người chơi khó đoán được liệu nó đang bet với value hand hay bluff. AI cân bằng hơn con người. Do đó, rất khó để con người có thể đoán được AI về một ván bài cụ thể.
Sau đây là một ví dụ về Libratus giới thiệu mức độ phức tạp cao cho bàn poker. Trong một cuộc phỏng vấn với Doug Polk, Daniel McAulay đã mô tả một bàn tay điên rồ mà anh ấy đã chơi với AI.Nhà cái khuyến mãi thành viên mới 88k.
AI giữ 5♣ 3♣ và Daniel giữ hai trái tim (các quân bài lỗ cụ thể của Daniel không quan trọng ở đây). Daniel raise tại vị trí, Libratus 3-bet, Daniel 4-bet, và cuối cùng Libratus call ngoài vị trí.
![[Poker Odds] Khai sáng từ trò lừa bịp điên cuồng của AI với 53 flush Nhà cái khuyến mãi thành viên mới 88k](https://276727.com/wp-content/uploads/2023/03/photo_2023-03-25_13-44-02.jpg)
Chúng ta đã thấy một số trò chơi phản trực giác mà Libratus thực hiện. Hầu hết mọi người sẽ bỏ bài này mỗi lần, hoặc thực hiện 5-bet bluff. Gọi ra khỏi vị trí có vẻ giống như một trò chơi thua trừ khi người chơi có thể thực hiện một số cược “nguy hiểm” trong tương lai. Nhưng Libratus có khả năng này!
Flop đến K♥ Q♥ J♣. Libratus check và Daniel check lại bằng flush draw.
Lượt đi mang đến trái tim thứ ba, khiến Daniel đỏ mặt. Libratus tiếp tục check, và Daniel check lại phía sau để đánh lừa đối thủ.Nhà cái khuyến mãi thành viên mới 88k.
River là một quân bài trống (chẳng hạn như 5♠) và Libratus đặt cược với cặp của mình. Daniel đã thực hiện một cú raise nhỏ, khiến cho cú raise của anh ấy trông giống như một trò lừa bịp, và Libratus đã dốc toàn lực, biến đôi dưới của anh ấy thành một trò lừa bịp. Tất nhiên, Daniel đã gọi và thắng ván bài.
Tuy nhiên, bàn tay mà Libratus mất không thành vấn đề. Quan trọng là, đường mà AI đang đi là một đường điên rồ mà hầu như không ai khác có thể đi, đặc biệt là những người chơi có lợi nhuận, những người biết rằng họ đang đại diện cho một phạm vi cực kỳ hẹp vì họ biết rằng họ đang chơi tốt ở turn và river. thụ động.Nhà cái khuyến mãi thành viên mới 88k.
Đây là nơi AI phát huy sức mạnh. Một người chơi cân bằng hoàn hảo có thể hiển thị bất kỳ thẻ nào trong mọi tình huống và với tần suất lý tưởng. Lưu ý rằng sự cân bằng và tối ưu là chìa khóa ở đây. Ví dụ: một người chơi có thể thử thực hiện một số hành động mà họ có thể coi là “ngẫu nhiên”. Tuy nhiên, trên thực tế, những hành động đó thường mang nặng tính thiên vị. Con người chúng ta đã không tìm thấy một sự cân bằng tốt.
Nếu bạn có vẻ khó hiểu bàn tay ở trên, bạn không đơn độc. Những người chơi hàng đầu chống lại Libratus cũng vậy, và họ có hàng triệu kinh nghiệm chơi poker. Tôi đưa bàn tay này ở đây để minh họa rằng con người gần như không thể tạo ra mức độ không thể đoán trước cân bằng hoàn hảo này. AI xây dựng một phạm vi hỗn hợp tinh vi để khiến đối thủ phải đoán, đồng thời thu lợi nhuận trong quá trình này.Nhà cái khuyến mãi thành viên mới 88k.
Chúng ta nên dành chút thời gian để hiểu điều này khó khăn như thế nào.
Ví dụ, Bob có thể dễ dàng không bao giờ bịp bợm, vì vậy anh ấy hoàn toàn trung thực và luôn có thể dự đoán được. Bob cũng có xu hướng lừa bịp mọi lúc, do đó lại có thể dự đoán được vì bây giờ đối thủ của anh ta sẽ cho rằng anh ta đặt cược với những ván bài rất yếu. Trong cả hai trường hợp, đối thủ của Bob, Alice, biết cô ấy sẽ phải đối mặt với những quân bài nào, vì vậy cô ấy có thể điều chỉnh chiến lược của mình cho phù hợp (bỏ hầu hết các quân bài trước, thường xuyên phản công lại quân sau).
Khó khăn đối với Bob là tìm ra ranh giới giữa lừa gạt và không lừa gạt để Alice không còn có quyết định rõ ràng nữa. Việc không có ranh giới rõ ràng sẽ khiến anh ta hoặc quá trung thực hoặc quá không trung thực, cả hai điều này đều có thể dễ dàng bị một đối thủ tinh ý như Alice lợi dụng.Nhà cái khuyến mãi thành viên mới 88k.
Tin tốt và tin xấu
Đó là một tin xấu đối với Bob, người không có thời gian cũng như mong muốn phát triển một chiến lược sinh lợi phức tạp như vậy. Alice thì sao? Chính sách tối ưu mà Libratus dường như dễ dàng tiếp cận không đơn giản như vẻ ngoài của nó. Vậy làm thế nào để Alice đảm bảo rằng cô ấy không bị lừa? May mắn thay, cô ấy không phải làm vậy.
Alice không đấu với một siêu trí tuệ nhân tạo như Libratus, cô ấy cũng không đấu với những người chơi poker hàng đầu thế giới. Alice chơi với những người bình thường như Bob, và chỉ thỉnh thoảng gặp một người chơi giỏi như cô ấy. Hầu như tất cả các đối thủ của cô ấy đều chơi theo quy tắc trung thực, với một vài ngoại lệ.Nhà cái khuyến mãi thành viên mới 88k.
Mason Malmuth và David Sklansky làm rõ điều này trong phần giới thiệu của họ về cuốn sách chiến lược poker của Mathew Janda Ứng dụng của No Limit Hold’em. Phần đó có tiêu đề là “Cảnh báo về việc bắt bài vô tội vạ” và về cơ bản nó là một lời cảnh báo cho người đọc về hậu quả của việc bỏ qua Luật trung thực khi bạn cố gắng gọi các khoản cược lớn một cách phòng thủ.
Điều mà các tuyên bố của họ cố gắng đạt được là cảnh báo người đọc rằng cố gắng bảo vệ bản thân khỏi bị lừa có thể không phải là lựa chọn có lợi nhất. Điều này rất đúng đối với những người chơi mới bắt đầu đến trung cấp, vì hầu hết các đối thủ của họ đều đang lừa bịp (so với các chiến lược GTO).Nhà cái khuyến mãi thành viên mới 88k.
Alice không thể đảm bảo rằng Bob luôn trung thực bằng cách thỉnh thoảng gọi điện. Nhưng nếu Bob chơi dưới mức lừa bịp ngay từ đầu, mọi cuộc gọi của Alice đều là thua lỗ trong thời gian dài. Sẽ có lợi hơn cho cô ấy nếu không bao giờ gọi cho Bob.
Tất nhiên, bằng cách không bao giờ gọi cược lớn cho Bob, Alice tạo ra khả năng lý thuyết rằng Bob có thể lợi dụng cô ấy bằng cách tăng tần suất lừa bịp của mình. Đây chính xác là điểm mà Janda cố gắng giải bài xì phé một cách tối ưu: nếu Alice ngừng gọi, về mặt lý thuyết, Bob có thể khai thác cô ấy.Nhà cái khuyến mãi thành viên mới 88k.
Tất nhiên, Malmuth và Sklansky phản đối: hầu hết Bob (người chơi poker trung bình) không đủ giỏi để nhận ra điều đó, và do đó khó có thể điều chỉnh. Tôi hoàn toàn đồng ý với họ. Cảm ơn Chúa Bob không phải là Libratus!
Dan B cũng đưa ra quan điểm tương tự trong bài báo “Ba lời kêu gọi đúng về mặt lý thuyết nhưng nên gấp lại trong thực tế”. Anh ấy nói: “The big fold có thể không phải là cách chơi hay nhất trong Texas Hold’em, nhưng nó thường đúng.” Dan B cũng trích dẫn quan điểm của Andres Artinano trong bài viết: “Tất cả những gì có thể nâng cấp là ‘Discarder’ ( thư mục)”Nhà cái khuyến mãi thành viên mới 88k.
Đó là tất cả cho ngày hôm nay, hãy theo dõi phần thứ ba trong loạt bài này vào tuần tới!
Giới thiệu về tác giả
Konstantinos “Duncan” Palamoudas là giáo sư toán học tại UCLA, chuyên về toán poker và dạy poker, và khóa học poker của ông tại UCLA cực kỳ nổi tiếng. Konstantions dự kiến sẽ xuất bản cuốn sách poker đầu tiên của mình vào năm 2020, trong đó ông sẽ giải thích một cách khoa học tại sao tiền của những người chơi poker nghiệp dư lại chảy vào túi những người chơi poker chuyên nghiệp bằng ngôn ngữ đơn giản.Nhà cái khuyến mãi thành viên mới 88k.