ปฐมนิเทศ AI Builders 2022
เตรียมความพร้อมก่อนเข้าสู่โครงการ AI Builders
แนวทางของโครงการ AI Builders
- substance over test scores and certificates; สิ่งที่บ่งบอกถึงความสำเร็จในการเรียนรู้ได้ดีที่สุด (และมีประโยชน์ในชีวิตจริงมากที่สุด) คือการสร้างโมเดล machine learning ที่แก้ปัญหาได้จริง ไม่ใช่คำพูด, คะแนนสอบ หรือ certificates ใดอย่างที่เขาหลอกลวง; แทบไม่เคยมีงานระดับโลกที่ไหนถามหาเกรด โรงเรียนที่จบ หรือ certificates อะไรทั้งนั้นสำหรับงาน machine learning; หากคุณทำงานอุตสาหกรรม คุณค่าของคุณคือประโยชน์ทางธุรกิจที่งานของคุณสร้าง หากคุณทำงานวิจัย คุณค่าของคุณคือประโยชน์ทางวิชาการของงานวิจัย
- methodology over tools; เราจะใช้ framework ไหน tool อะไร ไม่สำคัญเท่าความเชี่ยวชาญในวิธีการแก้ปัญหา framework หรือ tool อาจเปลี่ยนทุกปี แต่วิธีการแก้ปัญหาไม่ได้เปลี่ยนบ่อยขนาดนั้น เราอาจจะเริ่มเรียนรู้เกี่ยวกับ machine learning ด้วย fastai แต่ในที่สุดเราอาจจะใช้เครื่องมืออื่นที่เหมาะกับโครงงานเรามากกว่าก็ได้
- execution over ideas; ใครก็มีไอเดียได้ แม้เราจะคิดว่าไอเดียเราเจ๋งขนาดไหน (ความลับ: ทุกคนคิดว่าไอเดียตัวเองเจ๋งกว่าใครเสมอ) ความเป็นจริงก็คือมันไม่มีประโยชน์หากไม่สามารถเปลี่ยนเป็นผลลัพธ์ที่เป็นรูปธรรมได้
- follow the golden rule; ปฏิบัติกับเพื่อนร่วมโครงการและ mentor อย่างที่คุณอยากให้พวกเขาปฏิบัติกับคุณ;ข้อพึงปฏิบัติ
- there is no stupid questions; เรามาจากหลากหลายพื้นฐาน บางคนอาจจะเคยทำอะไรมามากหรือน้อยกว่าคนอื่น แต่สิ่งที่เรามีร่วมกันคือเป้าหมายในการเรียนรู้ ไม่มีคำถามใดง่ายเกินไปที่จะถาม และวิธีการเรียนรู้ที่ดีที่สุดคือการแบ่งปันความรู้ให้กับเพื่อนร่วมทาง
- sharing is caring; ชุดข้อมูลเปิดและโปรแกรม open source คือสาธารณูปโภคพื้นฐานของสังคม โค้ดทุกบรรทัด-ข้อมูลทุกชิ้นที่เราสร้างขึ้นอาจจะเป็นส่วนหนึ่งให้ใครนำไปพัฒนาสังคมต่อไปได้อย่างไม่รู้จบ เหมือนที่ NLP ภาษาไทยอาจจะพูดได้ว่าถูกวางรากฐานด้วยงาน open source ของ wannaphong
การประเมินโครงงานเพื่อจบการศึกษา
AI Builders จะออกใบประกาศนียบัตรจบการศึกษาให้กับผู้เข้าร่วมโครงการที่ส่งโครงงานได้คะแนนอย่างน้อย 70 จาก 100 คะแนนตามเกณฑ์ต่อไปนี้เท่านั้น และห้ามได้ 0 คะแนนในข้อใดข้อหนึ่ง
- problem statement; เหตุผลในการแก้ปัญหาเชิงธุรกิจ/ชีวิตประจำวันด้วย machine learning - 15 คะแนน
- metrics and baselines; การให้เหตุผลเชื่อมโยงการแก้ปัญหากับตัวชี้วัดที่เลือก / การวัดผลเทียบกับวิธีแก้ปัญหาในปัจจุบัน - 15 คะแนน
- data collection and cleaning; การเก็บและทำความสะอาดข้อมูล - 15 คะแนน
- exploratory data analysis; การทำความเข้าใจข้อมูล - 20 คะแนน
- modeling, validation and error analysis; การทำโมเดล, ทดสอบโมเดล และวิเคราะห์ข้อผิดพลาดของโมเดล - 20 คะแนน
- deployment; การนำโมเดลไปใช้แก้ปัญหาจริง - 15 คะแนน
งานที่ต้องส่งเพื่อรับการประเมิน
- Notebooks และ scripts ใน github
- บล็อกใน Medium.com อธิบายโครงงาน
- นำเสนอผลงานกับกรรมการ
กิจวัตรประจำสัปดาห์
- ดูวิดีโอบทเรียนประจำสัปดาห์จาก ai-builders/curriculum
- หากมีข้อสงสัยส่งคำถามเพื่อให้ทีมงานตอบในคาบได้ผ่านแบบฟอร์มออนไลน์ (ส่ง url ให้ทางอีเมล)
- ทุกเย็นวันพุธ จะมีคาบเรียนออนไลน์กันใน Wonder
3.1 18:00-18:30 ทีมงานตอบคำถามเกี่ยวกับบทเรียน-กลุ่มที่กำหนดในแต่ละสัปดาห์มาทำหน้าที่สรุปบทเรียนให้เพื่อนๆฟัง
3.2 18:30-19:00 พักระหว่างกิจกรรม พูดคุยพบปะกันตามอัธยาศัย
3.2 19:00-20:00 แยกย้ายไปตามกลุ่มเพื่อปรึกษาโครงงาน
Machine Learning Tasks
ประเภท Machine Learning ที่นิยมและรองรับโดยบทเรียนในโครงการ; ผู้เข้าร่วมโครงการสามารถเลือกทำโครงงานที่เกี่ยวกับโมเดลประเภทดังต่อไปนี้ (หรือประเภทอื่นๆตามแต่ปรึกษากับ mentor) ดูไอเดียโครงงานได้จาก: AI Builders showcase
- Images - ข้อมูลรูปภาพ
1.1 image classification - แยกแยะรูปภาพ (หมา/แมว ชนิดต้นไม้ ชนิดรถยนต์ ฯลฯ)
1.2 object detection - จับและแยกแยะสิ่งของในรูปภาพ (เลขทะเบียนรถ หน้าคน ตัวคน ฯลฯ)
1.3 image segmentation - แยกแยะแต่ละ pixel ในรูปภาพ (pixel ที่เป็นถนน เซลล์มะเร็ง ฯลฯ)
1.4 image generation - สร้างรูปภาพ (สร้างรูปตัวการ์ตูน สร้างหน้าคน ฯลฯ) - Texts - ข้อมูลข้อความ
3.1 sequence classification - ทำนายว่าข้อความเป็นประเภทไหน (ดี/แย่ ดาวรีวิว ประเภทข่าว ฯลฯ)
3.2 token classification - ทำนายว่าแต่ละ “คำ” ในข้อความเป็นประเภทไหน (คำนาม/สรรพนาม/กริยา สถานที่/ชื่อบุคคล/ตัวเลข ฯลฯ)
3.3 question answering - หาคำตอบของคำถามจากบริบท
3.4 information retrieval- ค้นหาข้อความ (ค้นหาสินค้า จับคู่ประโยค ฯลฯ)
3.5 text generation - สร้างข้อความ (แต่งเพลง แต่งนิยาย เขียนโฆษณา ฯลฯ)
3.6 automatic speech recognition - เปลี่ยนเสียงเป็นข้อความ - Tabular Data - ข้อมูลตาราง
2.1 recommendation - แนะนำสิ่งของ (สินค้า หนังสือ ภาพยนต์ ฯลฯ) จากข้อมูลในอดีต (การซื้อขาย การรับชม ฯลฯ)
2.2 cross-sectional prediction - ทำนายจากข้อมูลตาราง (ทำนายว่าลูกค้าจะคลิกโฆษณาหรือไม่ ทีมฟุตบอลทีมไหนจะชนะ ฯลฯ)
2.3 time-series forecasting - ทำนายจากข้อมูลอนุกรมเวลา (ราคาหุ้น ยอดขายรายวัน ฯลฯ)
เขียนวันที่: March 14, 2022