ปฐมนิเทศ AI Builders 2022

เตรียมความพร้อมก่อนเข้าสู่โครงการ AI Builders

แนวทางของโครงการ AI Builders

  1. substance over test scores and certificates; สิ่งที่บ่งบอกถึงความสำเร็จในการเรียนรู้ได้ดีที่สุด (และมีประโยชน์ในชีวิตจริงมากที่สุด) คือการสร้างโมเดล machine learning ที่แก้ปัญหาได้จริง ไม่ใช่คำพูด, คะแนนสอบ หรือ certificates ใดอย่างที่เขาหลอกลวง; แทบไม่เคยมีงานระดับโลกที่ไหนถามหาเกรด โรงเรียนที่จบ หรือ certificates อะไรทั้งนั้นสำหรับงาน machine learning; หากคุณทำงานอุตสาหกรรม คุณค่าของคุณคือประโยชน์ทางธุรกิจที่งานของคุณสร้าง หากคุณทำงานวิจัย คุณค่าของคุณคือประโยชน์ทางวิชาการของงานวิจัย
  2. methodology over tools; เราจะใช้ framework ไหน tool อะไร ไม่สำคัญเท่าความเชี่ยวชาญในวิธีการแก้ปัญหา framework หรือ tool อาจเปลี่ยนทุกปี แต่วิธีการแก้ปัญหาไม่ได้เปลี่ยนบ่อยขนาดนั้น เราอาจจะเริ่มเรียนรู้เกี่ยวกับ machine learning ด้วย fastai แต่ในที่สุดเราอาจจะใช้เครื่องมืออื่นที่เหมาะกับโครงงานเรามากกว่าก็ได้
  3. execution over ideas; ใครก็มีไอเดียได้ แม้เราจะคิดว่าไอเดียเราเจ๋งขนาดไหน (ความลับ: ทุกคนคิดว่าไอเดียตัวเองเจ๋งกว่าใครเสมอ) ความเป็นจริงก็คือมันไม่มีประโยชน์หากไม่สามารถเปลี่ยนเป็นผลลัพธ์ที่เป็นรูปธรรมได้
  4. follow the golden rule; ปฏิบัติกับเพื่อนร่วมโครงการและ mentor อย่างที่คุณอยากให้พวกเขาปฏิบัติกับคุณ;ข้อพึงปฏิบัติ
  5. there is no stupid questions; เรามาจากหลากหลายพื้นฐาน บางคนอาจจะเคยทำอะไรมามากหรือน้อยกว่าคนอื่น แต่สิ่งที่เรามีร่วมกันคือเป้าหมายในการเรียนรู้ ไม่มีคำถามใดง่ายเกินไปที่จะถาม และวิธีการเรียนรู้ที่ดีที่สุดคือการแบ่งปันความรู้ให้กับเพื่อนร่วมทาง
  6. sharing is caring; ชุดข้อมูลเปิดและโปรแกรม open source คือสาธารณูปโภคพื้นฐานของสังคม โค้ดทุกบรรทัด-ข้อมูลทุกชิ้นที่เราสร้างขึ้นอาจจะเป็นส่วนหนึ่งให้ใครนำไปพัฒนาสังคมต่อไปได้อย่างไม่รู้จบ เหมือนที่ NLP ภาษาไทยอาจจะพูดได้ว่าถูกวางรากฐานด้วยงาน open source ของ wannaphong

การประเมินโครงงานเพื่อจบการศึกษา

AI Builders จะออกใบประกาศนียบัตรจบการศึกษาให้กับผู้เข้าร่วมโครงการที่ส่งโครงงานได้คะแนนอย่างน้อย 70 จาก 100 คะแนนตามเกณฑ์ต่อไปนี้เท่านั้น และห้ามได้ 0 คะแนนในข้อใดข้อหนึ่ง

  1. problem statement; เหตุผลในการแก้ปัญหาเชิงธุรกิจ/ชีวิตประจำวันด้วย machine learning - 15 คะแนน
  2. metrics and baselines; การให้เหตุผลเชื่อมโยงการแก้ปัญหากับตัวชี้วัดที่เลือก / การวัดผลเทียบกับวิธีแก้ปัญหาในปัจจุบัน - 15 คะแนน
  3. data collection and cleaning; การเก็บและทำความสะอาดข้อมูล - 15 คะแนน
  4. exploratory data analysis; การทำความเข้าใจข้อมูล - 20 คะแนน
  5. modeling, validation and error analysis; การทำโมเดล, ทดสอบโมเดล และวิเคราะห์ข้อผิดพลาดของโมเดล - 20 คะแนน
  6. deployment; การนำโมเดลไปใช้แก้ปัญหาจริง - 15 คะแนน

งานที่ต้องส่งเพื่อรับการประเมิน

  1. Notebooks และ scripts ใน github
  2. บล็อกใน Medium.com อธิบายโครงงาน
  3. นำเสนอผลงานกับกรรมการ

กิจวัตรประจำสัปดาห์

  1. ดูวิดีโอบทเรียนประจำสัปดาห์จาก ai-builders/curriculum
  2. หากมีข้อสงสัยส่งคำถามเพื่อให้ทีมงานตอบในคาบได้ผ่านแบบฟอร์มออนไลน์ (ส่ง url ให้ทางอีเมล)
  3. ทุกเย็นวันพุธ จะมีคาบเรียนออนไลน์กันใน Wonder
    3.1 18:00-18:30 ทีมงานตอบคำถามเกี่ยวกับบทเรียน-กลุ่มที่กำหนดในแต่ละสัปดาห์มาทำหน้าที่สรุปบทเรียนให้เพื่อนๆฟัง
    3.2 18:30-19:00 พักระหว่างกิจกรรม พูดคุยพบปะกันตามอัธยาศัย
    3.2 19:00-20:00 แยกย้ายไปตามกลุ่มเพื่อปรึกษาโครงงาน

Machine Learning Tasks

ประเภท Machine Learning ที่นิยมและรองรับโดยบทเรียนในโครงการ; ผู้เข้าร่วมโครงการสามารถเลือกทำโครงงานที่เกี่ยวกับโมเดลประเภทดังต่อไปนี้ (หรือประเภทอื่นๆตามแต่ปรึกษากับ mentor) ดูไอเดียโครงงานได้จาก: AI Builders showcase

  1. Images - ข้อมูลรูปภาพ
    1.1 image classification - แยกแยะรูปภาพ (หมา/แมว ชนิดต้นไม้ ชนิดรถยนต์ ฯลฯ)
    1.2 object detection - จับและแยกแยะสิ่งของในรูปภาพ (เลขทะเบียนรถ หน้าคน ตัวคน ฯลฯ)
    1.3 image segmentation - แยกแยะแต่ละ pixel ในรูปภาพ (pixel ที่เป็นถนน เซลล์มะเร็ง ฯลฯ)
    1.4 image generation - สร้างรูปภาพ (สร้างรูปตัวการ์ตูน สร้างหน้าคน ฯลฯ)
  2. Texts - ข้อมูลข้อความ
    3.1 sequence classification - ทำนายว่าข้อความเป็นประเภทไหน (ดี/แย่ ดาวรีวิว ประเภทข่าว ฯลฯ)
    3.2 token classification - ทำนายว่าแต่ละ “คำ” ในข้อความเป็นประเภทไหน (คำนาม/สรรพนาม/กริยา สถานที่/ชื่อบุคคล/ตัวเลข ฯลฯ)
    3.3 question answering - หาคำตอบของคำถามจากบริบท
    3.4 information retrieval- ค้นหาข้อความ (ค้นหาสินค้า จับคู่ประโยค ฯลฯ)
    3.5 text generation - สร้างข้อความ (แต่งเพลง แต่งนิยาย เขียนโฆษณา ฯลฯ)
    3.6 automatic speech recognition - เปลี่ยนเสียงเป็นข้อความ
  3. Tabular Data - ข้อมูลตาราง
    2.1 recommendation - แนะนำสิ่งของ (สินค้า หนังสือ ภาพยนต์ ฯลฯ) จากข้อมูลในอดีต (การซื้อขาย การรับชม ฯลฯ)
    2.2 cross-sectional prediction - ทำนายจากข้อมูลตาราง (ทำนายว่าลูกค้าจะคลิกโฆษณาหรือไม่ ทีมฟุตบอลทีมไหนจะชนะ ฯลฯ)
    2.3 time-series forecasting - ทำนายจากข้อมูลอนุกรมเวลา (ราคาหุ้น ยอดขายรายวัน ฯลฯ)
เขียนวันที่: March 14, 2022