ปฐมนิเทศน์ 2021 - Orientation and Intro to Essential Tools
เตรียมความพร้อมก่อนเข้าสู่โครงการ AI Builders
Orientation (60 mins)
แนวทางของโครงการ AI Builders
- substance over test scores and certificates; สิ่งที่บ่งบอกถึงความสำเร็จในการเรียนรู้ได้ดีที่สุด (และมีประโยชน์ในชีวิตจริงมากที่สุด) คือการสร้างโมเดล machine learning ที่แก้ปัญหาได้จริง ไม่ใช่คำพูด, คะแนนสอบ หรือ certificates ใดอย่างที่เขาหลอกลวง; แทบไม่เคยมีงานระดับโลกที่ไหนถามหาเกรด โรงเรียนที่จบ หรือ certificates อะไรทั้งนั้นสำหรับงาน machine learning; หากคุณทำงานอุตสาหกรรม คุณค่าของคุณคือประโยชน์ทางธุรกิจที่งานของคุณสร้าง หากคุณทำงานวิจัย คุณค่าของคุณคือประโยชน์ทางวิชาการของงานวิจัย
- methodology over tools; เราจะใช้ framework ไหน tool อะไร ไม่สำคัญเท่าความเชี่ยวชาญในวิธีการแก้ปัญหา framework หรือ tool อาจเปลี่ยนทุกปี แต่วิธีการแก้ปัญหาไม่ได้เปลี่ยนบ่อยขนาดนั้น เราอาจจะเริ่มเรียนรู้เกี่ยวกับ machine learning ด้วย fastai แต่ในที่สุดเราอาจจะใช้เครื่องมืออื่นที่เหมาะกับโครงงานเรามากกว่าก็ได้
- execution over ideas; ใครก็มีไอเดียได้ แม้เราจะคิดว่าไอเดียเราเจ๋งขนาดไหน (ความลับ: ทุกคนคิดว่าไอเดียตัวเองเจ๋งกว่าใครเสมอ) ความเป็นจริงก็คือมันไม่มีประโยชน์หากไม่สามารถเปลี่ยนเป็นผลลัพธ์ที่เป็นรูปธรรมได้
- follow the golden rule; ปฏิบัติกับเพื่อนร่วมโครงการและ mentor อย่างที่คุณอยากให้พวกเขาปฏิบัติกับคุณ;ข้อพึงปฏิบัติ
- there is no stupid questions; เรามาจากหลากหลายพื้นฐาน บางคนอาจจะเคยทำอะไรมามากหรือน้อยกว่าคนอื่น แต่สิ่งที่เรามีร่วมกันคือเป้าหมายในการเรียนรู้ ไม่มีคำถามใดง่ายเกินไปที่จะถาม และวิธีการเรียนรู้ที่ดีที่สุดคือการแบ่งปันความรู้ให้กับเพื่อนร่วมทาง
- sharing is caring; ชุดข้อมูลเปิดและโปรแกรม open source คือสาธารณูปโภคพื้นฐานของสังคม โค้ดทุกบรรทัด-ข้อมูลทุกชิ้นที่เราสร้างขึ้นอาจจะเป็นส่วนหนึ่งให้ใครนำไปพัฒนาสังคมต่อไปได้อย่างไม่รู้จบ เหมือนที่ NLP ภาษาไทยอาจจะพูดได้ว่าถูกวางรากฐานด้วยงาน open source ของ wannaphong
การประเมินโครงงานเพื่อจบการศึกษา
AI Builders จะออกใบประกาศนียบัตรจบการศึกษาให้กับผู้เข้าร่วมโครงการที่ส่งโครงงานได้คะแนนอย่างน้อย 70 จาก 100 คะแนนตามเกณฑ์ต่อไปนี้เท่านั้น
- problem statement; เหตุผลในการแก้ปัญหาเชิงธุรกิจ/ชีวิตประจำวันด้วย machine learning - 15 คะแนน
- metrics and baselines; การให้เหตุผลเชื่อมโยงการแก้ปัญหากับตัวชี้วัดที่เลือก / การวัดผลเทียบกับวิธีแก้ปัญหาในปัจจุบัน - 15 คะแนน
- data collection and cleaning; การเก็บและทำความสะอาดข้อมูล - 15 คะแนน
- exploratory data analysis; การทำความเข้าใจข้อมูล - 20 คะแนน
- modeling, validation and error analysis; การทำโมเดล, ทดสอบโมเดล และวิเคราะห์ข้อผิดพลาดของโมเดล - 20 คะแนน
- deployment; การนำโมเดลไปใช้แก้ปัญหาจริง - 15 คะแนน
งานที่ต้องส่งเพื่อรับการประเมิน
- Notebooks และ scripts ใน github
- บล็อกใน Medium.com อธิบายโครงงาน
- นำเสนอผลงานกับกรรมการ
กิจวัตรประจำสัปดาห์
- ดูวิดีโอบทเรียนประจำสัปดาห์จาก fastai
- หากมีข้อสงสัยส่งคำถามเพื่อให้ทีมงานตอบในคาบได้ผ่าน slido
- เมื่อถึงวันคาบเรียนทุกวันพุธ
3.1 18:00-19:00 Mentor สรุปบทเรียนและตอบคำถามในบทเรียน
3.2 19:00-20:00 แยกย้ายไปตามกลุ่มเพื่อปรึกษาโครงงาน (เฉพาะผู้เข้าร่วมที่ทำโครงงาน)
Machine Learning Tasks
ประเภท Machine Learning ที่นิยมและรองรับโดยบทเรียนในโครงการ (fastai, huggingface); ผู้เข้าร่วมโครงการสามารถเลือกทำโครงงานที่เกี่ยวกับโมเดลประเภทดังต่อไปนี้ (หรือประเภทอื่นๆตามแต่ปรึกษากับ mentor) ดูไอเดียโครงงานได้จาก: Project Idea Gallery
- image - ข้อมูลรูปภาพ
1.1 image classification (fastai) - แยกแยะรูปภาพ (หมา/แมว ชนิดต้นไม้ ชนิดรถยนต์ ฯลฯ)
1.2 object detection (fastai) - จับและแยกแยะสิ่งของในรูปภาพ (เลขทะเบียนรถ หน้าคน ตัวคน ฯลฯ)
1.3 image segmentation (fastai) - แยกแยะแต่ละ pixel ในรูปภาพ (pixel ที่เป็นถนน เซลล์มะเร็ง ฯลฯ) - tabular data - ข้อมูลตาราง
2.1 recommendation (fastai) - แนะนำสิ่งของ (สินค้า หนังสือ ภาพยนต์ ฯลฯ) จากข้อมูลในอดีต (การซื้อขาย การรับชม ฯลฯ)
2.2 cross-sectional prediction (fastai) - ทำนายจากข้อมูลตาราง (ทำนายว่าลูกค้าจะคลิกโฆษณาหรือไม่ ทีมฟุตบอลทีมไหนจะชนะ ฯลฯ)
2.3 time-series forecasting (fastai) - ทำนายจากข้อมูลอนุกรมเวลา (ราคาหุ้น ยอดขายรายวัน ฯลฯ) - natural language processing - ข้อมูลข้อความ
3.1 sequence classification (fastai, huggingface) - ทำนายว่าข้อความเป็นประเภทไหน (ดี/แย่ ดาวรีวิว ประเภทข่าว ฯลฯ)
3.2 token classification (huggingface) - ทำนายว่าแต่ละ “คำ” ในข้อความเป็นประเภทไหน (คำนาม/สรรพนาม/กริยา สถานที่/ชื่อบุคคล/ตัวเลข ฯลฯ)
3.3 question answering (huggingface) - หาคำตอบของคำถามจากบริบท
3.4 information retrieval (huggingface) - ค้นหาข้อความ (ค้นหาสินค้า จับคู่ประโยค ฯลฯ)
3.5 text generation (fastai, huggingface) - สร้างข้อความ (แต่งเพลง แต่งนิยาย เขียนโฆษณา ฯลฯ)
3.6 automatic speech recognition (huggingface) - เปลี่ยนเสียงเป็นข้อความ
Introduction to Essential Tools (60 mins)
เรียนเครื่องมือพื้นฐานในการเขียนโปรแกรมไปกับ ลุงวิศวกรสอนคำนวน
แบบฝึกหัด
ทำแบบฝึกหัดได้ที่ ai-builders-orientation
เขียนวันที่: February 23, 2021