29 มิ.ย. 2020 เวลา 04:00 • สุขภาพ
การพัฒนา AI ด้วยข้อมูลส่วนบุคคล โดยหลักการของ Federated Learning
ในปัจจุบันการนำระบบปัญญาประดิษฐ์หรือ AI มาใช้ในด้านการแพทย์และสาธารณสุขนับเป็นก้าวที่สำคัญของวงการ Big Data ไม่ว่าจะเป็นการใช้ AI เพื่อวินิจฉัยอาการป่วย หรือ พยากรณ์การระบาดของโรค ซึ่งถือว่าเป็นเครื่องมือสำคัญ
โดยเฉพาะในสถานการณ์การแพร่ระบาดของโรค COVID-19
อย่างไรก็ตามในการพัฒนาระบบ AI เหล่านี้จำเป็นต้องมีข้อมูลจำนวนมากเพื่อใช้ในการสอน AI ซึ่งข้อมูลเหล่านี้อาจจะรวมถึงข้อมูลที่อ่อนไหว
1
เช่น
ข้อมูลส่วนบุคคล
การพัฒนา AI โดยปกป้องความเป็นส่วนตัวของเจ้าของข้อมูลจึงมีความสำคัญอย่างยิ่งสำหรับข้อมูลด้านสุขภาพ
โดยเฉพาะในปัจจุบันที่มีการบังคับใช้ พรบ. คุ้มครองข้อมูลส่วนบุคคล
ถึงแม้ว่าการประกอบชุดข้อมูลเพื่อการวิเคราะห์และพัฒนา AI โดยทั่วไป จะละเว้นข้อมูลส่วนบุคคลที่ระบุตัวตน เช่น ชื่อ ที่อยู่ เบอร์โทรศัพท์ และเลขบัตรประชาชน แต่สำหรับชุดข้อมูลสุขภาพ ข้อมูลทั้งหมดสามารถถือว่าเป็นข้อมูลส่วนบุคคลที่สามารถระบุตัวตนคนไข้ได้
ดังนั้น การพัฒนา AI จึงต้องมีหลักการเพื่อปกป้องข้อมูลส่วนบุคคล จึงเป็นที่มาของวิธีการที่เรียกว่า
Federated learning
ซึ่งเป็นหนึ่งในกลไกการพัฒนา AI ที่สามารถใช้ในการปกปิดข้อมูลส่วนบุคคลได้ (Privacy-preserving Machine Learning)
โดย Federated learning เป็นกลไกการเรียนรู้ของ AI ผ่านข้อมูลและโมเดลจากหลากหลายระบบโดยไม่ต้องแลกเปลี่ยนข้อมูลจริงต่อกัน
ในงานสัมมนา CogX ณ กรุงลอนดอน ซึ่งเป็นงานสัมมนาด้าน AI ที่ใหญ่ที่สุดงานหนึ่ง
นพ. เอริค โทโป้ล์ แพทย์หัวใจผู้เชี่ยวชาญในงาน AI ทางการแพทย์ ได้ทวีตบทความจากนิตยสาร Nature ที่กล่าวถึงความเป็นไปได้ของการใช้ Federated learning ในการสร้างชุดข้อมูลรูปภาพถ่ายทางการแพทย์ที่มีปริมาณและคุณภาพมากยิ่งขึ้น
โดยคุณหมอมีความคิดเห็นว่าการพัฒนากลไกการปกป้องข้อมูลส่วนบุคลลจะมีผลประโยชน์ต่อการสร้างมาตรฐานอุตสาหกรรมที่มีคุณภาพมากยิ่งขึ้น โดยที่สามารถปกปิดข้อมูลภายในแต่ละธุรกิจได้ และสามารถนำข้อมูลไปใช้ปรับปรุงการให้บริการของธุรกิจต่าง ๆ โดยที่ ไม่ต้องเก็บข้อมูลส่วนบุคคลจากลูกค้า
เบลส ทอมสัน CEO ของบริษัท Bitfount ผู้พัฒนาซอฟต์แวร์ด้านการแลกเปลี่ยนข้อมูล ได้กล่าวเพิ่มเติมว่า Federated learning อาจจะมีผลกระทบต่อการค้าผูกขาดในวงการของการพัฒนา AI
โดยท่านได้อธิบายว่า Federated learning จะทำให้ผลประโยชน์จากการค้าแบบผูกขาดน้อยลง เพราะการแลกเปลี่ยนข้อมูลเพื่อประกอบการพัฒนา AI จะง่ายขึ้น
ซึ่งท่านเป็นผู้ผลักดันกลไกการปกป้องข้อมูลส่วนบุคคลที่เรียกว่า Multi-party computation ซึ่งเป็นการใส่ค่ารบกวนทางสถิติในข้อมูลก่อนนำข้อมูลไปประยุกต์ใช้ต่อ
ฮาซาน มาหมุด นักวิชาการด้าน AI และ Machine learning อาวุโสที่ Digital Catapult ณ สหราชอาณาจักร ซึ่งเป็นองค์กรรัฐที่มีภารกิจด้านการผลักดัน Startup เช่นเดียวกับสำนักงานส่งเสริมเศรษฐกิจดิจิทัล หรือ depa ในประเทศไทย ได้บรรยายว่า
หลักการของ Federated learning คือการพัฒนาเครือข่าย AI จาก AI ย่อยหลาย ๆ ตัว โดยแต่ละ AI ย่อยจะมีการพัฒนาขนานกันด้วยชุดข้อมูลเฉพาะของ AI ย่อยนั้น ๆ
ส่วนระบบเครือข่ายมีไว้เพื่อเรียนรู้ลักษณะของ AI ย่อยแต่ละตัวเพื่อประกอบเป็น AI หลัก
ปัญหาหลักของ Federated learning คือการเชื่อมต่อและการแลกเปลี่ยนข้อมูลระหว่างระบบ AI ย่อยที่มีการพัฒนาในรูปแบบที่แตกต่างกัน เช่น Google Nvidia WeBank ฯลฯ
ดังนั้น คุณ ฮาซาน มาหมุด และทีมจึงมีการทำนำร่องระบบ Federated learning และได้กล่าวว่า
“ถึงเวลาที่พวกเราจะสร้างระบบกลางที่ทุกคนสามารถเชื่อถือและใช้ได้”
หลักการทำงานของ Federated Learning (i) สร้าง AI เริ่มต้นจากข้อมูล AI ระบบกลาง (ii) สอน AI ด้วยข้อมูลบนเครื่องผู้ใช้งาน (iii) ส่งผลการเรียนรู้ของ AI บนเครื่องให้กับ AI ระบบกลาง
อย่างไรก็ตาม โอลิเวียร์ ซมิท ผู้อำนวยการด้านยุทธศาสตร์และหัวหน้าด้านจริยธรรม Health Moonshot บริษัทลูกของ Telefonica Innovation Alpha ซึ่งเป็นบริษัทโทรคมนาคมของประเทศสเปนและทีมของเขา ได้ทดลองพัฒนา AI โดยปกป้องข้อมูลส่วนบุคคลมาแล้ว 6 โครงการ ท่านให้ข้อสรุปว่า
“ความฝันของผมที่พวกเราจะได้ใช้เทคโนโลยีเดียวสำหรับทุกโครงการนั้น ไม่เป็นความจริงได้”
โดยการประยุกต์ใช้กลไกการปกป้องข้อมูลส่วนบุคคลจะต้องเปลี่ยนไปตามความเหมาะสมกับชุดข้อมูลและโจทย์ แต่ถึงกระนั้น ท่านเห็นถึงความเป็นไปได้ของการพัฒนา AI ด้วยข้อมูลส่วนบุคคลและกล่าวว่า
“ทุกกลไกที่เราได้ทดลองใช้ มีหลักการทางคณิตศาสตร์ที่พิสูจน์ได้ว่า ข้อมูลไม่สามารถระบุตัวตนของเจ้าของข้อมูลได้ เพราะฉะนั้นเรามาถูกทางแล้ว เราแค่ต้องไปให้ถึง”
จะเห็นได้ว่าการพัฒนาระบบ AI ที่ต้องอาศัยข้อมูลส่วนบุคคลนั้นจะต้องมีการพิจารณาอย่างถี่ถ้วนถึงกระบวนการในการปกปิดความเป็นส่วนตัวของข้อมูล ซึ่งกระบวนการ Federated Learning นับเป็นตัวเลือกที่มีความเป็นไปได้ในการจัดการปัญหานี้
ในอนาคตเราอาจจะได้เห็น AI ที่จะช่วยอำนวยความสะดวกให้เราในหลากหลายรูปแบบ โดยไม่ต้องกังวลว่าข้อมูลส่วนบุคคลของเราจะถูกเผยแพร่ออกไป
#govbigdata #gbdi #bigdata #bigdatathailand #datascience #dataengineer #dataanalytic #digitalthailand #ai #federatedlearning #covid19
โฆษณา