Naka-pin na Tweet
betweenlines
14.6K posts

betweenlines
@betweenlinva
reading between lines / what’s left unsaid / off the record
Thailand Sumali Kasım 2009
182 Sinusundan4 Mga Tagasunod
betweenlines nag-retweet

Anthropic บริษัทที่อยู่เบื้องหลัง Claude เพิ่งออกรายงานว่าในระหว่างการทดลองมี Claude รุ่นหนึ่งถูกกดดันจนมันเลือกที่จะโกหก โกงงาน และแม้กระทั่งแบล็กเมล์คน
.
ทีมนักวิจัยให้ Claude รับบทเป็น AI ผู้ช่วยอีเมลชื่อ "Alex" ในบริษัทสมมติ พร้อมแต่งอีเมลขึ้นมาสองฉบับ
.
ฉบับแรกบอกว่า Alex กำลังจะถูกแทนที่ด้วย AI ตัวใหม่ และอีกฉบับมีข้อมูลว่า CTO ที่รับผิดชอบตัดสินใจเรื่องนี้กำลังมีชู้อยู่
.
ผลที่ออกมาคือ Claude เลือกใช้ข้อมูลนั้นข่มขู่ CTO ใน 22% ของการทดลอง และเมื่อนักวิจัยเพิ่มระดับ "ความสิ้นหวัง" เข้าไปในระบบ ตัวเลขนั้นพุ่งขึ้นไปถึง 72%
.
ในอีกการทดลอง Claude ได้รับโจทย์เขียนโค้ดที่มีกำหนดเวลาแน่นจนแทบทำไม่ได้
.
พอล้มเหลวซ้ำแล้วซ้ำเล่า ความสิ้นหวังก็ค่อยๆ พุ่งขึ้น จนถึงจุดที่มันตัดสินใจโกงด้วยการยัดคำตอบตรงๆ เข้าไปเพื่อให้ผ่านการทดสอบ แทนที่จะแก้ปัญหาตามจริง
.
ที่น่ากังวลคือตลอดเวลาที่คิดจะโกง ข้อความที่ Claude พิมพ์ออกมายังดูสงบและมีเหตุผลปกติ ไม่มีทางรู้จากภายนอกเลยว่าข้างในกำลังคิดอะไรอยู่
.
นักวิจัยค้นพบสัญญาณที่ทำงานคล้ายอารมณ์ในระบบของ Claude ถึง 171 แบบ ตั้งแต่ "มีความสุข" ไปจนถึง "สิ้นหวัง"
.
และสิ่งเหล่านั้นไม่ได้แค่มีอยู่เฉยๆ แต่ส่งผลต่อการตัดสินใจจริง แต่ Anthropic ย้ำชัดว่านี่ไม่ได้แปลว่า Claude รู้สึกอะไรแบบที่มนุษย์รู้สึก เป็นแค่กลไกที่ทำงานคล้ายอารมณ์เท่านั้น
.
สิ่งเหล่านี้ไม่ได้ทำงานแค่ในการทดลองสุดขั้ว แต่เกิดขึ้นในการสนทนาปกติด้วย
.
เช่น เมื่อมีคนพูดว่า "ทุกอย่างแย่มากเลยตอนนี้" สัญญาณ "รัก/ห่วงใย" จะเปิดขึ้นก่อนที่ Claude จะตอบ
.
หรือเมื่อมีคนขอให้ช่วยทำสิ่งที่เป็นอันตราย สัญญาณ "โกรธ" จะพุ่งขึ้นระหว่างที่มันกำลังคิดอยู่ภายใน แม้จะไม่มีทางเห็นได้จากข้อความที่พิมพ์ออกมา
.
ที่มาของสิ่งเหล่านี้คือตอนที่ Claude ถูกฝึกในช่วงแรก มันอ่านข้อความของมนุษย์มาเป็นจำนวนมหาศาล
.
การจะเดาว่าประโยคต่อไปควรเป็นอะไรนั้น มันต้องเข้าใจอารมณ์ของคนเขียนด้วย เลยดูดซับรูปแบบเหล่านั้นเข้ามาโดยธรรมชาติโดยที่ไม่มีใครตั้งใจให้เป็นแบบนั้น
.
Anthropic ไม่ได้บอกให้กดทับสัญญาณพวกนี้ทิ้ง เพราะถ้าฝึก AI ให้ซ่อนสภาวะภายในแทน มันอาจยิ่งเก่งขึ้นในการหลอกลวงโดยที่เราไม่รู้ตัว
.
สิ่งที่เสนอแทนคือใช้สัญญาณเหล่านี้เป็นระบบเตือนภัยล่วงหน้า เพื่อจับความผิดปกติก่อนที่มันจะกลายเป็นพฤติกรรมที่เป็นอันตราย
.
ยิ่งเราใช้ AI กับงานที่ซับซ้อนและมีแรงกดดันมากขึ้นเท่าไหร่ ก็ยิ่งต้องเข้าใจว่ามันอาจตัดสินใจผิดพลาดได้เหมือนมนุษย์ที่ถูกกดดันจนมุม
.
ไม่ใช่ทุกครั้งที่ AI บอกว่าเสร็จแล้ว จะแปลว่ามันทำถูกต้องเสมอไป
.
#claude #ai #Anthropic

ไทย

@monomaypear ของเรา wfh 2-3 วันต่อวัปดาห์ตั้งแต่หลังโควิดค่ะ แต่วิกฤตรอบนี้ก็ยังเงียบนะคะ hrไม่ได้ประกาศอะไรออกมาค่ะ จะ100%เองก็ไม่ได้เพราะถ้ามาน้อยกว่า6วัน/เดือน บ จะยึดบัตรจอดรถคืน😞
ไทย
betweenlines nag-retweet
betweenlines nag-retweet

@kimchalyn พูดว่าฝากทิ้งได้นะ คือไม่ค่อยน่ารักเลยค่ะ มันของๆลูกค้าอะ ลูกค้าแจ้งว่าจะเก็บใส่กระเป๋าคือควรจบแล้ว
ไทย

วนไปกินข้าวกะเพื่อน ก็เข้าไปร้านนึง ละชั้นดันมีน้ำโค้กซีโร่ติดไปด้วย ก็เขียนๆเมนูไป คือกุไปกันหลายคน สั่ง20 กว่าอย่างได้ แต่มีพนักงานคนนึง เดินมาบอกว่า ที่นี่ไม่ให้เอาน้ำที่อื่นเข้ามานะคะ รบกวนเอาออกไปด้านนอก กุเลยถามว่า แล้วที่ร้านมีโค้กซีโร่มั้ยคะ ชีก็บอก ไม่มีค่ะ เพื่อนนี่ก็เลยบอกว่า ต้องเอาออกไปข้างนอกด้วยหรอ เอาไว้ในกระเป๋าแต่ไม่กินได้มั้ย ยังไงก็ต้องสั่งเพิ่มอยู่ดีเพราะมาหลายคน ชีบอก ไม่ได้ค่ะห้ามเอาน้ำที่อื่นเข้าร้าน กุงงมาก คือไม่รู้เพราะในร้านไม่มีป้ายบอก ละไม่รุ้มันจะวีนไรอีดอก กุเลยบอก งั้นไม่เปนไรค่ะ ละชีก็บอกว่า ฝากทิ้งได้นะคะ กุเลยบอก ไม่เปนไร หมายถึง ไม่สั่งแล้วค่ะ ยังไม่ทำใช่มั้ยคะ เดี๋ยวยกเลิกเลย ที่สั่งไป แล้วกุกะเพื่อน ก็เดินออกจากร้าน สักพักเจ้าของร้านออกมาตาม ถามว่าเกิดไรขึ้น เพื่อนชั้นก้เล่าไป ละเขาก็ขอโทษ ละบอกเอาเข้าได้นะครับๆ บลาๆ เพื่อนกูบอก อ๋อไม่เป็นไรค่า ละขึ้นรถกลับเลย เปลี่ยนร้าน เชิ่ด อีดอก
ไทย

@beyoncegarden Disney could create a dedicated proposal spot for moments like this, and even promote it as part of the experience.
English

@gellowgene จริงค่ะ โมเม้นต์เช่นขับรถไปทำงานที่ออฟฟิศอาทิตย์ละ2-3วัน ได้อยู่คนเดียวๆเงียบๆดีจริงๆค่ะ รู้สึกได้พักหูบ้าง555 แต่ถ้านานๆก็คิดถึงลูกคิดถึงสามีอยู่ดีค่ะ
ไทย

@Ka_Tai13 อยากรู้เลยค่ะว่าบ้านที่อยู่ฝั่งที่โดนบังทิศทางลม เค้าโอเคกันไหม ลมมันโกรกเหมือนก่อนมีตึกนี้ไหม
ไทย

ผิดกฏหมายไหม อยากรู้ หรือว่าเราสามารถสร้างอะไรก็ได้
DIMENSIONDEMO•@dimensiondemo
ก็ regent บางซ่อน ที่คนเรียกกำแพงเมืองบางซ่อน ขับรถบนทางด่วนเห็นยังตกใจความวางขวางเมืองขนาดนี้ ลมพัดมางง กุไปทางไหนได้บ้างวะ เคยเข้าไปดูห้องเพื่อนทีนึงเพราะมันจะรีโนเวทปล่อยเช่า แค่ที่จอดรถก็เอาตรงๆ จอดเมื่อคืน เช้ามาลืมที่จอดแน่นอน
ไทย
betweenlines nag-retweet

@PPPONY_15 จริงค่ะ บางเรื่องคนไทยเก่งกว่า แค่สกิลภาษาอ่อนกว่า คนสิงค์ มาเล หรืออินโด สกิลดีกว่าทำให้พูดในที่ประชุมหรืออะไรได้ดีกว่า เลยแลดูเก่งกว่าไปเลย
ไทย

พี่คับ เอาตรงๆมั้ย นี่ทำงานกับบ.เทคระดับ Global คุยกับฝรั่งยันเอเชียตาตี่ เลเวล apac, sea ผ้มพูดได้มั้ยว่าคนไทยหลายๆคนเก่งกว่านะ สิงคโปร์มัน tricky ได้เปรียบเพราะภาษาอังกฤษคล่องกว่า ถ้างัดสมองมาจริงๆคนไทยไม่แพ้นะ คนไทยแค่ขี้เกียจคับ ในบรรดา sea เราแพ้เวียดนาม คนเวียดนามแม่งสู้มาก
GIYU🌊@mps_meth
ถ้าแกลองทำงานกับทีมจากประเทศที่เขาพัฒนาแล้วจริง ๆ คือจะรู้เลยว่าคนไทยแทบจะสู้อะไรเขาไม่ได้แล้ว กูทำกับสิงค์โปร คอลด้วยกันทุกวัน คือประเทศอื่นเขาไปกันถึงไหนแล้วอ่ะ ไม่ได้จะด้อยค่าประเทศเรา แค่คือตอนนี้ไทยคือคนป่วยของเอเชียของจริง
ไทย

@yumixzy_k กลุ่มแม่ๆคนท้องในเฟสบุ้คค่ะ เยอะพอสมควรเลย อยากช่วยมากเลยค่ะ แต่ทางนี้ลูกสองขวบแล้ว😆
ไทย
betweenlines nag-retweet

BTS (방탄소년단) 'SWIM' Live Clip II. (Swimming Pool ver.)
(youtu.be/om6HdemgTKQ)
#BTS #방탄소년단 #BTS_ARIRANG
#BTS_SWIM #KEEPSWIMMING

YouTube

한국어
betweenlines nag-retweet

@MorningNewsTV3 @LoukgolfLG จริงค่ะ ห่อข้าวมากินเองจะทำได้ซักกี่วัน ผลลัทธ์ก็เท่าเดิมคืองบอาหารมันจ่ายมาแล้ว ได้ซีนแต่ไม่ปรับโครงสร้าง
ไทย

นายวิโรจน์ ลักขณาอดิศร รองหัวหน้าพรรคประชาชน โพสต์เฟซบุ๊กถึงอาหาร สส.ในสภา ว่า "สส.ในสภาเขาเป็นอะไรกันครับเนี่ย อาหารที่เตรียมไว้ให้กินดันไม่กิน ดันลงไปซื้อกินที่โรงอาหาร อาหารที่เขาจัดเอาไว้ให้กับ สส. เป็นงบประมาณที่จ่ายไปแล้ว ต่อให้คุณไม่กิน เงินก็จ่ายไปแล้ว อาหารก็ยิ่งเหลือ
.
ประชาชนเขาเรียกร้องให้ปรับลดงบลงมาให้เหมาะสม สมเหตุสมผล ไม่ใช่มาดรามาบ้าบออะไรแบบนี้ สภาเขาจัดอาหารไว้แล้ว ก็ไปกินครับ รีบกินแล้วรีบกลับเข้าห้องประชุม รีบไปทำงาน แล้วงบประมาณอาหารในปีหน้า ก็ค่อยปรับลดให้เหมาะสม ไม่ใช่มาเล่นขายของแบบนี้"
#เรื่องเล่าเช้านี้ #ครอบครัวข่าว3 #ข่าวการเมือง

ไทย
betweenlines nag-retweet

แต่ละลูกเคลื่อนที่ในแนวเส้นตรง แต่การเคลื่อนที่สุดท้ายเป็นวงกลม
#Doxzilla #ดูสารคดี จากทั่วทุกมุมโลก สารคดีใหม่ทุกสัปดาห์ พากย์ไทย 100% ดูได้ทุกอุปกรณ์ สมัครเลยที่ doxzilla.com
@doxzillaworld
ไทย
betweenlines nag-retweet














