燕故念
2019-08-01 04:10:26

Watson ของไอบีเอ็มเปิดตัวครั้งแรกสำหรับผู้ชมทางโทรทัศน์ระดับชาติเมื่อคืนที่ผ่านมาในรายการ ของ CBS เพื่อความถูกต้องอวาตาร์ของเขาก็เรืองรองอยู่หลังเวทีกลางเวทีของเขา อย่างไรก็ตามเขามีปุ่มจริงที่จะผลักดันเมื่อเขาพร้อมที่จะกดปุ่มตอบคำถามที่เป็นรูปแบบที่เป็นอันตราย ปุ่มดังกล่าวเปิดใช้งานโดยแอปพลิเคชันที่ออกแบบมาเป็นพิเศษซึ่งทำงานอยู่ใน คลัสเตอร์เซิร์ฟเวอร์ IBM POWER7 ของเขาซึ่งมีหน่วยเก็บข้อมูล IBM Scale-Out NAS ( )

จากมุมมองของฉันวัตสันนั้นน่าทึ่งอย่างแท้จริงในช่วง 15 นาทีแรกของการแสดงโดยให้คำตอบและเลือกหมวดหมู่คำถามถัดไปด้วยความเร็วที่ทำให้ไม่เห็น ผู้เข้าแข่งขันแบรดรัทเทอร์และเคนเจนนิงส์ยืนนิ่งเงียบและมองดูว่าวัตสันชนะรางวัลของเขาอย่างไร จากนั้นวัตสันก็ดูเหมือนจะถ่วงไปนิดหน่อย จริง ๆ แล้วเขาก็ให้คำตอบที่ผิดเหมือนกันกับหนึ่งในผู้แข่งขัน ในช่วง 15 นาทีที่สองแบรดจับได้และเคนขุดตัวเองออกจากหลุม อืมม วัตสันตัดสินใจเลือกผู้สร้างมนุษย์ที่น่าขายหน้าหรือไม่?

เราอาจจะไม่มีทางรู้ดังนั้นให้เรามุ่งเน้นไปที่สิ่งที่เรารู้ จากมุมมองของพื้นที่จัดเก็บข้อมูลจำนวนมากถูกสร้างขึ้นจากข้อมูลจำนวนมหาศาลที่วัตสันดึงข้อมูลและความสามารถในการคำนวณความน่าจะเป็นของคำตอบที่ "ถูกต้อง" จากรายการของผู้ชนะที่มีศักยภาพหลายรายในเวลาประมาณสามวินาทีหรือน้อยกว่า ความสามารถของ Watson ในการแยกการรวมข้อมูลขนาดใหญ่และการเรียงสับเปลี่ยนตามเวลาจริงนำไปสู่การขยายเทคโนโลยีพื้นฐานของ Watson ในการวิเคราะห์ข้อมูลขนาดใหญ่ของไอบีเอ็ม

ทุกอย่างดีและดี แต่นี่คือสิ่งที่ฉันพบว่าน่าสนใจที่สุดซึ่งเป็นผลมาจากสิ่งที่ไอบีเอ็มทำเพื่อตอบสนองต่อการ ที่กระตุ้นผู้สร้างวัตสัน เรารู้จาก ว่ารากฐานของระบบจัดเก็บข้อมูลของ Watson เป็นคลัสเตอร์ IBM SONAS ที่ได้รับการแก้ไขซึ่งมีความจุรวม 21.6TB แต่เพียร์สันยังเผยอีกว่ามีความสำคัญมากและสำหรับผมแล้วจุดข้อมูลที่น่าประหลาดใจ: "เมื่อวัตสันบู๊ตขึ้นมา RAM ทั้งหมด 15TB จะถูกโหลดขึ้นมาและหลังจากนั้นการประมวลผล DeepQA จะทำจากหน่วยความจำ ขนาดของข้อมูล (วิเคราะห์และจัดทำดัชนีข้อความฐานความรู้ ฯลฯ ) ที่ใช้สำหรับการสร้างคำตอบของผู้สมัครและการประเมินหลักฐานต่ำกว่า 1 เทราไบต์ "

สิ่งที่เพียร์สันเพิ่งพูดก็คือว่าชุดข้อมูลวัตสันใช้จริง ๆ เพื่อเข้าถึงการตัดสินใจปุ่มกดของเขาจะพอดีกับไดรฟ์ 1TB มากสำหรับข้อมูลขนาดใหญ่?

สำหรับฉันวัตสันพูดอย่างคล่องแคล่วกับสิ่งที่ฉันคิดว่าเป็นปริศนาข้อมูลขนาดใหญ่ ใช่ระบบการวิเคราะห์ธุรกิจใหม่ที่ฉันได้เขียนเกี่ยวกับจะถูกป้อนข้อมูลจำนวนมากจากหลายแหล่งและใช่ข้อมูลขนาดใหญ่แสดงถึงโอกาสที่ยิ่งใหญ่สำหรับผู้จัดเก็บ จากนั้นวัตสันก้าวขึ้นและพูดว่า "หมดเวลาแล้วฉันต้องการเทราไบต์เท่านั้น"

วัตสันรู้ดีว่า ณ เวลาใดเวลาหนึ่งข้อมูลเพียงเล็กน้อยที่เขามีอยู่นั้นมีความเกี่ยวข้องกับปัญหาที่เขาแก้ไข สิ่งที่เขาและผู้สร้างของเขาได้เรียนรู้ที่จะทำหลังจากเล่นเกมจำลอง Jeopardy หลายเกมในห้องแล็บนั้นได้พัฒนาชุดข้อมูลขนาดกะทัดรัดที่แม่นยำและไม่น่าเชื่อซึ่งเหมาะกับความทรงจำของวัตสัน ในความเป็นจริงหน่วยความจำของ Watson สามารถจัดการกับสำเนาและรุ่นของชุดข้อมูลได้อย่างง่ายดาย

ฉันคิดว่าสิ่งที่วัตสันเปิดเผยสำหรับผู้เชี่ยวชาญด้านสตอเรจและผู้ขายไม่ได้เป็นเพียงความต้องการในการจัดเก็บข้อมูลจำนวนมากทั้งในขั้นตอนการจัดเก็บข้อมูลและจัดเก็บข้อมูลเท่านั้น แต่ยังจำเป็นต้องพัฒนาสิ่งที่ฉันคิด คำถามที่วัตสันนำเสนอแก่นักพัฒนาระบบจัดเก็บข้อมูลคือ: คุณช่วยฉันได้เฉพาะข้อมูลที่เกี่ยวข้องหรือไม่? ใช่แคชระบบจัดเก็บข้อมูลเป็นเอนจิ้นที่เกี่ยวข้อง แต่เป็นระบบดั้งเดิมที่ดีที่สุดเมื่อเทียบกับสิ่งที่วัตสันประสบความสำเร็จ

แบ่งปันเสียงของคุณ

แท็ก