ปฐมนิเทศน์ 2021 - Orientation and Intro to Essential Tools

เตรียมความพร้อมก่อนเข้าสู่โครงการ AI Builders

Orientation (60 mins)

แนวทางของโครงการ AI Builders

  1. substance over test scores and certificates; สิ่งที่บ่งบอกถึงความสำเร็จในการเรียนรู้ได้ดีที่สุด (และมีประโยชน์ในชีวิตจริงมากที่สุด) คือการสร้างโมเดล machine learning ที่แก้ปัญหาได้จริง ไม่ใช่คำพูด, คะแนนสอบ หรือ certificates ใดอย่างที่เขาหลอกลวง; แทบไม่เคยมีงานระดับโลกที่ไหนถามหาเกรด โรงเรียนที่จบ หรือ certificates อะไรทั้งนั้นสำหรับงาน machine learning; หากคุณทำงานอุตสาหกรรม คุณค่าของคุณคือประโยชน์ทางธุรกิจที่งานของคุณสร้าง หากคุณทำงานวิจัย คุณค่าของคุณคือประโยชน์ทางวิชาการของงานวิจัย
  2. methodology over tools; เราจะใช้ framework ไหน tool อะไร ไม่สำคัญเท่าความเชี่ยวชาญในวิธีการแก้ปัญหา framework หรือ tool อาจเปลี่ยนทุกปี แต่วิธีการแก้ปัญหาไม่ได้เปลี่ยนบ่อยขนาดนั้น เราอาจจะเริ่มเรียนรู้เกี่ยวกับ machine learning ด้วย fastai แต่ในที่สุดเราอาจจะใช้เครื่องมืออื่นที่เหมาะกับโครงงานเรามากกว่าก็ได้
  3. execution over ideas; ใครก็มีไอเดียได้ แม้เราจะคิดว่าไอเดียเราเจ๋งขนาดไหน (ความลับ: ทุกคนคิดว่าไอเดียตัวเองเจ๋งกว่าใครเสมอ) ความเป็นจริงก็คือมันไม่มีประโยชน์หากไม่สามารถเปลี่ยนเป็นผลลัพธ์ที่เป็นรูปธรรมได้
  4. follow the golden rule; ปฏิบัติกับเพื่อนร่วมโครงการและ mentor อย่างที่คุณอยากให้พวกเขาปฏิบัติกับคุณ;ข้อพึงปฏิบัติ
  5. there is no stupid questions; เรามาจากหลากหลายพื้นฐาน บางคนอาจจะเคยทำอะไรมามากหรือน้อยกว่าคนอื่น แต่สิ่งที่เรามีร่วมกันคือเป้าหมายในการเรียนรู้ ไม่มีคำถามใดง่ายเกินไปที่จะถาม และวิธีการเรียนรู้ที่ดีที่สุดคือการแบ่งปันความรู้ให้กับเพื่อนร่วมทาง
  6. sharing is caring; ชุดข้อมูลเปิดและโปรแกรม open source คือสาธารณูปโภคพื้นฐานของสังคม โค้ดทุกบรรทัด-ข้อมูลทุกชิ้นที่เราสร้างขึ้นอาจจะเป็นส่วนหนึ่งให้ใครนำไปพัฒนาสังคมต่อไปได้อย่างไม่รู้จบ เหมือนที่ NLP ภาษาไทยอาจจะพูดได้ว่าถูกวางรากฐานด้วยงาน open source ของ wannaphong

การประเมินโครงงานเพื่อจบการศึกษา

AI Builders จะออกใบประกาศนียบัตรจบการศึกษาให้กับผู้เข้าร่วมโครงการที่ส่งโครงงานได้คะแนนอย่างน้อย 70 จาก 100 คะแนนตามเกณฑ์ต่อไปนี้เท่านั้น

  1. problem statement; เหตุผลในการแก้ปัญหาเชิงธุรกิจ/ชีวิตประจำวันด้วย machine learning - 15 คะแนน
  2. metrics and baselines; การให้เหตุผลเชื่อมโยงการแก้ปัญหากับตัวชี้วัดที่เลือก / การวัดผลเทียบกับวิธีแก้ปัญหาในปัจจุบัน - 15 คะแนน
  3. data collection and cleaning; การเก็บและทำความสะอาดข้อมูล - 15 คะแนน
  4. exploratory data analysis; การทำความเข้าใจข้อมูล - 20 คะแนน
  5. modeling, validation and error analysis; การทำโมเดล, ทดสอบโมเดล และวิเคราะห์ข้อผิดพลาดของโมเดล - 20 คะแนน
  6. deployment; การนำโมเดลไปใช้แก้ปัญหาจริง - 15 คะแนน

งานที่ต้องส่งเพื่อรับการประเมิน

  1. Notebooks และ scripts ใน github
  2. บล็อกใน Medium.com อธิบายโครงงาน
  3. นำเสนอผลงานกับกรรมการ

กิจวัตรประจำสัปดาห์

  1. ดูวิดีโอบทเรียนประจำสัปดาห์จาก fastai
  2. หากมีข้อสงสัยส่งคำถามเพื่อให้ทีมงานตอบในคาบได้ผ่าน slido
  3. เมื่อถึงวันคาบเรียนทุกวันพุธ
    3.1 18:00-19:00 Mentor สรุปบทเรียนและตอบคำถามในบทเรียน
    3.2 19:00-20:00 แยกย้ายไปตามกลุ่มเพื่อปรึกษาโครงงาน (เฉพาะผู้เข้าร่วมที่ทำโครงงาน)

Machine Learning Tasks

ประเภท Machine Learning ที่นิยมและรองรับโดยบทเรียนในโครงการ (fastai, huggingface); ผู้เข้าร่วมโครงการสามารถเลือกทำโครงงานที่เกี่ยวกับโมเดลประเภทดังต่อไปนี้ (หรือประเภทอื่นๆตามแต่ปรึกษากับ mentor) ดูไอเดียโครงงานได้จาก: Project Idea Gallery

  1. image - ข้อมูลรูปภาพ
    1.1 image classification (fastai) - แยกแยะรูปภาพ (หมา/แมว ชนิดต้นไม้ ชนิดรถยนต์ ฯลฯ)
    1.2 object detection (fastai) - จับและแยกแยะสิ่งของในรูปภาพ (เลขทะเบียนรถ หน้าคน ตัวคน ฯลฯ)
    1.3 image segmentation (fastai) - แยกแยะแต่ละ pixel ในรูปภาพ (pixel ที่เป็นถนน เซลล์มะเร็ง ฯลฯ)
  2. tabular data - ข้อมูลตาราง
    2.1 recommendation (fastai) - แนะนำสิ่งของ (สินค้า หนังสือ ภาพยนต์ ฯลฯ) จากข้อมูลในอดีต (การซื้อขาย การรับชม ฯลฯ)
    2.2 cross-sectional prediction (fastai) - ทำนายจากข้อมูลตาราง (ทำนายว่าลูกค้าจะคลิกโฆษณาหรือไม่ ทีมฟุตบอลทีมไหนจะชนะ ฯลฯ)
    2.3 time-series forecasting (fastai) - ทำนายจากข้อมูลอนุกรมเวลา (ราคาหุ้น ยอดขายรายวัน ฯลฯ)
  3. natural language processing - ข้อมูลข้อความ
    3.1 sequence classification (fastai, huggingface) - ทำนายว่าข้อความเป็นประเภทไหน (ดี/แย่ ดาวรีวิว ประเภทข่าว ฯลฯ)
    3.2 token classification (huggingface) - ทำนายว่าแต่ละ “คำ” ในข้อความเป็นประเภทไหน (คำนาม/สรรพนาม/กริยา สถานที่/ชื่อบุคคล/ตัวเลข ฯลฯ)
    3.3 question answering (huggingface) - หาคำตอบของคำถามจากบริบท
    3.4 information retrieval (huggingface) - ค้นหาข้อความ (ค้นหาสินค้า จับคู่ประโยค ฯลฯ)
    3.5 text generation (fastai, huggingface) - สร้างข้อความ (แต่งเพลง แต่งนิยาย เขียนโฆษณา ฯลฯ)
    3.6 automatic speech recognition (huggingface) - เปลี่ยนเสียงเป็นข้อความ

Introduction to Essential Tools (60 mins)

เรียนเครื่องมือพื้นฐานในการเขียนโปรแกรมไปกับ ลุงวิศวกรสอนคำนวน

  1. Jupyter Notebooks and Google Colaboratory
  2. Bash commands
  3. มาเริ่มใช้ Git กัน [part 1]

แบบฝึกหัด

ทำแบบฝึกหัดได้ที่ ai-builders-orientation

เขียนวันที่: February 23, 2021