มือใหม่หันเขียนโค้ด
Software Design

👶 Azure Cognitive Services

มาดูกันว่าคลาว์มี AI สำเร็จรูปแบบไหนให้เราเล่นได้บ้าง ?

นักพัฒนาหลายคนกำลังมองหาวิธีทำให้แอพมีลูกเล่นใหม่ๆ เช่นการนำ AI เข้ามาช่วย แต่หลายครั้งที่เจอคำว่า AI แล้วก็ส่ายหน้า เพราะคิดว่าของพวกนี้มันน่าจะเขียนโค้ดยาก ต้องเก่งด้านคณิตศาสตร์ชั้นสูงไรงี้ แต่ในความจริงแล้วเชื่อไหมว่าคนที่หัดเขียนโค้ดใหม่ๆก็สามารถเอา AI มาใช้งานได้แล้ว เพราะตัว AI นั้นจริงๆมีหลายระดับ ซึ่งในคอร์สนี้ผมจะพูดถึงการใช้ AI ในแบบที่ทุกคนจับต้องได้ด้วยสิ่งที่เรียกว่า Azure Cognitive Services ครับ

🤔 Azure Cognitive Services คืออะไร?

ขอเคลียให้เข้าใจตรงกันก่อนว่าสมัยก่อนถ้าเราจะเขียน AI ซักตัว เราจะต้องเริ่มเขียนกันใหม่ตั้งแต่เริ่มต้นเลย ดังนั้นมันเลยทำให้คนที่เขียน AI ต้องมีความรู้ในหลายๆอย่างเป็นอย่างมากถึงจะสร้างชิ้นงานออกมาซักตัวได้

จากปัญหาที่ว่ามาทาง Microsoft ก็เจอกับปัญหาพวกนี้เหมือนกัน เพราะเขาก็เขียน AI แต่ไหนๆก็เขียนออกมาแล้ว เขาเลยได้เอา AI ที่คนส่วนใหญ่ชอบใช้ ออกมาเป็นให้บริการบนคลาว์ เราจะได้ไม่ต้องไปเขียนใหม่ตั้งแต่ต้น แต่เปลี่ยนไปใช้ AI สำเร็จรูปที่มีอยู่แล้วได้เลย ตัวอย่างเช่น การตรวจใบหน้า การแปลงเสียงเป็นข้อความ การแปลภาษา การค้นหา แผนที่ การทายอายุจากรูป การถอดข้อความจากรูป และอื่นๆอีกยาวเหยียด

ดังนั้นสรุปง่ายๆคือ Microsoft มี AI สำเร็จรูปให้เราใช้ได้เลยนั่นก็คือ Cognitive Services นั่นเอง

🤔 Azure Cognitive Services ทำไรได้บ้าง ?

ทาง Microsoft ได้ทำการแบ่งกลุ่มของ Cognitive Services ออกเป็น 5 กลุ่มความสามารถตามนี้

กลุ่ม

เกี่ยวกับ

Vision

การทำงานที่เกี่ยวกับ media ต่างๆ เช่นรูป วีดีโอ

Speech

การทำงานที่เกี่ยวกับเสียง

Language

การทำงานที่เกี่ยวกับภาษา เช่น แปลภาษา หรือ การจับใจความ

Decision

การทำงานที่เกี่ยวข้องกับการตัดสินใจ เช่นมีคำหยาบไหม

Search

การทำงานที่เกี่ยวข้องกับการค้นหา เช่น ค้นหารูป เขียนข้อความผิดหรือเปล่า

จากทั้ง 5 กลุ่มที่ว่ามา เดี๋ยวเราลองไปดูรายละเอียดของแต่ละกลุ่มกันเลย

🤔 Vision ทำอะไรได้บ้าง ?

กลุ่มนี้มี AI สำเร็จรูปอยู่ทั้งหมด 6 อย่าง

🤖 Computer Vision

ตัวนี้จะสามารถวิเคราะห์ข้อมูลจากรูปได้ ซึ่งตัวอย่างที่เอามาโชว์ให้ดูคือ

การวิเคราะห์ภาพ

ตัวอย่างนี้จะแจกแจงของต่างๆที่อยู่ในรูปออกมาให้เราได้ เช่นจากตัวอย่างมันสามารถบอกได้ว่า มีคนอยู่ในรูป เป็นชานชาลา มีรถไฟ มีผู้หญิง และของแต่ละอย่างอยู่ตำแหน่งแกน X:Y

การถอดรูปภาพเป็นตัวหนังสือ (OCR)

รู้จักแบรนด์สินค้า คนดัง และสถานที่สำคัญ

การวิเคราะห์วีดีโอ

🤖 Face

ตัวนี้สามารถทำการตรวจสอบทุกอย่างที่เกี่ยวกับใบหน้าได้ เช่น อายุเท่าไหร่ ผู้ชายผู้หญิง อยู่ในอารมณ์ไหน ใส่แว่นไหม รูปสองรูปนี้ใช่คนเดียวกันไหม บลาๆ ขอยกตัวอย่างรูปแค่อันเดียวละกันไม่งั้นบทความนี้ยาวแน่ๆ

🤖 Ink Recogniser

ตัวนี้จะเป็นการทำงานที่เกี่ยวกับการเขียนที่อยู่ในรูปดิจิตอล เช่นพวกลายมือ ลายเซ็นอะไรพวกนี้ ซึ่งตัว AI ก็จะสามารถแจกแจงรายละเอียดของพวกนั้นออกมาได้ เช่นในรูปด้านล่างมันก็จะรู้ว่าเราวาดรูปวงกลม และเขียนคำว่า Microsoft

🤖 Video Indexer

ตัวนี้จะสามารถตรวจรายละเอียดต่างๆของวีดีโอได้ เช่นวีดีโอพูดว่าอะไร หรือพูดอีกนัยว่ามันสามารถถอด metadata ของวีดีโอได้นั่นเอง เช่นปรกติเวลาค้นหาเราสามารถค้นหาจากข้อความได้ แต่ตัวนี้จะสามารถทำให้เราเอาข้อความไปค้นหาจากตัววีดีโอได้เลย

🤖 Custom Vision

ตัวนี้เป็นตัวช่วยให้เราสามารถสร้างการแยกแยะสิ่งของในรูปแบบที่เรากำหนดเอง เช่น ในรูปมีตราบริษัทเราหรือเปล่า หรือแยกว่ารูปที่ส่งเข้ามาเป็นดอกไม้แบบชนิดไหน

🤖 Form Recognizer

ตัวนี้จะสามารถทำความเข้าใจรูปแบบฟอร์มแล้วแปลงมันออกมาเป็นข้อความได้ เช่น เรามีเอกสารเยอะๆแล้วต้องเอาเอกสารมาคีย์เข้าระบบที่ละแผ่น ก็แทนที่เราจะทำเองเราก็ให้ AI แปลงข้อความให้เราเลย

🤔 Speech ทำอะไรได้บ้าง ?

กลุ่มนี้มี AI สำเร็จรูปอยู่ทั้งหมด 2 อย่าง

🤖 Speech Services

ตัวนี้จะสามารถ แปลงคำพูดเป็นข้อความ, แปลงข้อความเป็นคำพูด และ แปลภาษาได้ ไม่มีรูปภาพปลากรอบเน่อ

🤖 Speech Recognition

ตัวนี้จะสามารถแยกแยะได้ว่า คนพูดคือใคร และยืนยันได้ว่าเสียงนี้เป็นของคนๆนั้นจริงหรือไม่ ตัวอย่างที่เห็นได้ชัดเจนสุดคือการทำ Login ด้วยเสียง

🤔 Language ทำอะไรได้บ้าง ?

กลุ่มนี้มี AI สำเร็จรูปอยู่ทั้งหมด 5 อย่าง

🤖 Text Analytics

ตัวนี้จะสามารถรับรู้ได้ว่า ข้อความนั้นผู้พิมพ์รู้สึกยังไง แยกวลีได้ แยกแยะสิ่งของหรือบอกได้ว่าเป็นภาษาอะไร ได้ ตัวอย่างที่เห็นภาพได้ชัด เอาไว้วิเคราะห์ว่ามีใครกำลังด่าเราอยู่ใน Twitter หรือเปล่า ฮ่าๆ

🤖 Translator Text

ตัวนี้คือวุ้นแปลภาษาของโดเรม่อนไง ซึ่งมันสามารถแปลงข้อความจากภาษานึงไปยังภาษาอื่นๆได้

🤖 QnA Maker

ตัวนี้จะสามารถสร้าง คำถามที่ถามบ่อย จากข้อมูลที่เรามีได้

🤔 Decision ทำอะไรได้บ้าง ?

กลุ่มนี้มี AI สำเร็จรูปอยู่ทั้งหมด 3 อย่าง

🤖 Content Moderator

สามารถดูรูปภาพวีดีโอข้อความต่างๆ แล้วตรวจสอบได้ว่ามีของที่ไม่เหมาะสมอยู่ในั้นหรือเปล่าได้

🤖 Anomaly Detector

ตัวนี้จะช่วยตรวจสอบว่ามีของที่ผิดปรกติเกิดขึ้น ก่อนที่ปัญหามันจะเกิดให้เราได้ เช่นเตือนว่าหุ้นตัวนี้มันจะดิ่งลงเหวนะ ทั้งๆที่มันยังไม่ดิ่งเลย

🤖 Personaliser

ตัวนี้จะสามารถช่วยให้เราสร้าง User experience ให้ผู้ใช้ได้ดีขึ้น โดยการทำ loop เพื่อประเมินผลความชอบของผู้ใช้

🤔 Search ทำอะไรได้บ้าง

กลุ่มนี้มี AI สำเร็จรูปอยู่ทั้งหมด 10 อย่าง แต่ขอเขียนแบบรวมๆนะครับบทความนี้มันยาวมากแล้ว

🤖 Bing Specll Check

ตรวจสอบคำที่เขียนผิด

ค้นหาข้อมูลต่างๆจากเว็บทั่วโลก

ค้นหาวีดีโอ

ค้นหาข่าวสาร

🤖 Bing Autosuggest

สร้างการแนะนำของต่างๆให้เพื่อเป็นตัวเลือกให้ผู้ใช้ได้เลือก

🎯 บทสรุป

การที่เราจะเอา AI เข้ามาใช้ในแอพของเราจริงๆมันไม่จำเป็นต้องไปเขียนใหม่ตั้งแต่เริ่มต้น เพราะคลาว์ก็มีให้บริการอยู่แล้ว ดังนั้นเราก็แค่เลือกใช้ AI ที่เขามีก็จะสามารถประหยัดเวลาในการไปสร้าง AI ขั้นมาตั้งแต่ต้น อีกทั้งบนคลาว์ AI มันจะฉลาดขึ้นไปเรื่อยๆและมีตัวเลือกมากขึ้นเรื่อยๆด้วยเช่นกัน ทำให้การใช้งาน AI ก็จะไม่ใช่เรื่องยากอีกต่อไป