Technology

10 ชุดข้อมูลฝึกอบรมปัญญาประดิษฐ์

2024-04-25 09:31:48




จากการมาของเทคโนโลยี AI ที่เข้ามามีบทบาทสำคัญในการช่วยอำนวยความสะดวกในชีวิตมากขึ้น ซึ่งกว่าเทคโนโลยีนี้จะสามารถในการประมวลผลอย่างชำนาญนั้นจะมีการฝึกอบรมอัลกอริทึมจากชุดข้อมูลที่มีคุณภาพสูงมากมายเพื่อให้สามารถจำแนกและวิเคราะห์ได้อยากถูกต้อง ในปัจจุบันมีคอลเล็กชันชุดข้อมูลที่มีคุณภาพมากมายที่สามารถฝึกให้ AI นั้นสามารถทำงานได้อย่างมีประสิทธิภาพอยู่ 10 อันดับได้แก่


1.Microsoft COCO

เป็นชุดข้อมูลที่ได้รับการยกย่องว่าเป็นมาตรฐานในชุมชนนักพัฒนา ซึ่งข้อมูลภายในคอลเล็กชันครอบคลุมรูปภาพที่มีป้ายกำกับจำนวนมาก โดยออกแบบมาเพื่ออำนวยความสะดวกในการวิจัยเกี่ยวกับการจดจำวัตถุ การแบ่งส่วน และคำบรรยายภาพ เป็นการก้าวข้ามขอบเขตของความเข้าใจด้วยภาพและส่งเสริมนวัตกรรมในอัลกอริทึมการมองเห็นของคอมพิวเตอร์


โดยภายในชุดข้อมูลนั้นรูปภาพ 330K (มีป้ายกำกับ>200K) พร้อมคำบรรยาย 5 รายการต่อรูปภาพ ชุดข้อมูลประกอบด้วยอินสแตนซ์ออบเจ็กต์ 1.5 ล้านรายการ และบุคคล 250,000 คนพร้อมประเด็นสำคัญ มีคลาสกว่า 80 คลาส สามารถนำมาใช้งานในการแบ่งส่วนวัตถุ และการจดจำวัตถุต่าง ๆ สามารถใช้งานได้ทั้งวัตถุประสงค์ทางการค้าและการวิจัย


2.CIFAR-10 และCIFAR-100

ชุดข้อมูลนี้ย่อมาจากCanadian Institute For Advanced Research เป็นชุดข้อมูลที่ประกอบด้วยคอลเล็กชันรูปภาพที่หลากหลายซึ่งรวบรวมไวเพื่อฝึกอบรมเรียนรู้ของMachine learning และอัลกอริทึมการมองเห็นของคอมพิวเตอร์โดยเฉพาะ ถือว่าเป็นอีกหนึ่งชุดข้อมูลที่มีคุณภาพและใช้งานกันอย่างแพร่หลาย


โดยมีหน้าที่ที่เป็นเกณฑ์มาตรฐานสำหรับการทดลองและการประเมินผลมากมาย ใช้ในการจำแนกภาพ ภายในชุดข้อมูลมีภาพสี 60,000 ภาพ (32x32 พิกเซล) แบ่งออกเป็นชุดฝึกอบรม 50,000 ชุดและชุดย่อยการทดสอบ 10,000 ชุด ชุดข้อมูลประกอบด้วย 6,000 รูปภาพต่อชั้นเรียน โดยCIFAR-10 และCIFAR-100 จะแตกต่างกันที่จำนวนคลาสที่ CIFAR-10 จะมีอยู่ 10 คลาส และCIFAR-100 มีอยู่ 100 คลาส


3.ImageNet

เป็นขุดข้อมูลขนาดใหญ่ที่เปลี่ยนแปลงขอบเขตการมองเห็นของ AI ด้วยข้อมูลภายในชุดเป็นภาพที่มีป้ากำกับมากกว่า 14 ล้านภาพซึ่งครอบคลุมในแต่ละหมวดหมู่วัตถุกว่า 1000 หมวด และด้วยขนาดของชุดข้อมูลขนาดใหญ่ทำให้สามารถเป็นทรัพยากรพัฒนาการจำแนกภาพ การตรวจจับวัตถุ และงานทำความเข้าใจภาพ


ImageNet Large Scale Visual Recognition Challenge (ILSVRC) ได้กลายเป็นชุดย่อยที่ได้รับความนิยมมากที่สุดซึ่งประกอบด้วยการฝึกอบรม 1.3M, การตรวจสอบความถูกต้อง 50,000 ภาพ และภาพทดสอบ 100,000 ภาพ แต่ชุดข้อมูลนี้ไม่สามารถใช้งานได้ในเชิงพาณิชย์


4.YouTube-8M

เป็นชุดข้อมูลเพื่อการจัดหมวดหมู่รูปภาพในวิดีโอ การจดจำการกระทำ การจัดหมวดหมู่วิดีโอ โดยตัวชุดข้อมูลมีID วิดีโอ 6.1M, วิดีโอ 350,000 ชั่วโมง วิดีโอประกอบด้วยคุณสมบัติภาพและเสียง 2.6 พันล้านรายการ ชุดข้อมูลนำเสนอ ซึ่งคอลเล็กชันที่ครอบคลุมที่ช่วยให้นักวิจัยสามารถจัดการงานต่างๆ เช่น การจัดหมวดหมู่วิดีโอ การสรุปวิดีโอ และการแนะนำเนื้อหา ขนาดอันมหาศาลและความหลากหลายที่หลากหลายของชุดข้อมูลนี้ทำให้เป็นทรัพย์สินอันล้ำค่าสำหรับการพัฒนาและฝึกอบรมโมเดลการเรียนรู้เชิงลึก


โดยชุดข้อมูลนี้สามารถใช้ในเชิงพาณิชย์ การดัดแปลง การจัดจำหน่าย การใช้สิทธิบัตร การใช้ส่วนตัว


5.IMDB-WIKI

ชุดข้อมูลสำหรับนักวิจัยและนักพัฒนาที่ใช้ในการจดจำใบหน้าและการคาดการณ์อายุ โดยข้อมูลชุดนี้รวบรวมรูปภาพจาก IMBb และ Wikipedia ทำให้ชุดข้อมูลนี้มีคอลเล็กชันรูปภาพใบหน้าที่มีป้ายกำกับอายุ เพศ จำนวนมากและมีข้อมูลประชากรหลากหลาย


โดยชุดข้อมูลประกอบไปด้วยรูปภาพมากกว่า 500,000 ภาพพร้อมป้ายกำกับอายุและเพศ และมีคลาสกว่าพันคลาส สามารถนำไปใช้งานที่ไม่ใช่เชิงพาณิชย์เท่านั้น


6.CityScapes

เป็นชุดข้อมูลที่ออกแบบมาเพื่อประเมินประสิทธิภาพอัลกอริทึมการมองเห็นให้สามารถทำความเข้าใจในฉากเมืองได้ มีการสนับสนุนการวิจัยที่ใช้งานข้อมูลที่มีคำอธิบายประกอบและข้อมูลที่ไม่ชัดเจนที่ใช้ในการฝึกโมเดล AI ข้อมูลประกอบด้วยลำดับวิดีโอสเตอริโอที่หลากหลายที่บันทึกในฉากท้องถนนจาก50 เมืองพร้อมคำอธิบายประกอบระดับพิกเซลสำหรับ 5,000 เฟรมและคำอธิบายประกอบที่ไม่ชัดเจนเพิ่มเติมสำหรับ 20,000เฟรม


โดยภายในชุดข้อมูลกว่า 50 เมือง รูปภาพกว่า 25,000 ภาพ คลาสจำนวน 30 คลาส สามารถใช้ในการฝึกสอนทำความเข้าใจฉากเมืองโดยนำไปใช้งานได้โดยโมเดลนั้นไม่ใช่เชิงพาณิชย์


7. Fashion-MNIST

ชุดข้อมูลเสื้อผ้าแฟชั่นที่สร้างขึ้นโดย Zelando ที่ประกอบไปด้วยรูปภาพเสื้อผ้าสีขาวดำกว่า 70,000 ภาพภายในคอลเล็กชัน ซึ่งได้รับการออกแบบมาเพื่อทดแทนชุดข้อมูล MNIST ตั้งเดิมเพื่อช่วยนักวิจัยสามารถเปรียบเทียบอัลกอริทึมการเรียนรู้เครื่องโดยใช้ขนาดรูปภาพและการแยกฝึกอบรมและการทดสอบที่เท่ากับ Zalando โดยมีเป้าหมายที่จะมาแทนชุดข้อมูล MNIST


ภายในคอลเล็กชันนี้จะมีภาพระดับสีเทา 70,000 ภาพ (28x28 พิกเซล) คลาส 10 คลาสที่ออกแบบมาใช้กับการจัดหมวดหมู่รูปภาพ สามารถใช้งานได้ทั้งเชิงพาณิชย์และไม่ใช่เชิงพาณิชย์


8.MNIST

เป็นชุดฐานข้อมูลตัวเลขที่มีการเขียนด้วยลายมือ ภายในชุดจะมีชุดฝึกอบรม 60,000 ตัวอย่างและ 10,000 ตัวอย่าง เป็นชุดย่อยของชุดที่ใหญ่กว่าจาก NIST ตัวเลขได้รับการปรับขนาดให้เป็นมาตรฐานและจัดให้อยู่กึ่งกลางของรูปภาพที่มีขนาดคงที่ ออกแบบมาเพื่อเป็นฐานข้อมูลสำหรับลองใช้เทคนิคการเรียนรู้และวิธีการจดจำรูปแบบจากข้อมูลในโลกแห่งความเป็นจริง


โดยภายในชุดจะมีภาพสีขาวดำ 70,000 ภาพ (28x28 พิกเซล) แบ่งออกเป็นชุดฝึกอบรม 60,000 ชุดและชุดย่อยการทดสอบ 10,000 ชุด คลาส 10 คลาสที่ใช้งานในการรู้จำลายมือ การจัดหมวดหมู่รูปภาพ สามารถใช้งานได้ทั้งเชิงพาณิชย์และไม่ใช่เชิงพาณิชย์


9.MPII Human Pose

ชุดข้อมูลเป็นเกณฑ์มาตรฐานชั้นนำสำหรับการประเมินการประมาณท่าทางของมนุษย์แบบชัดแจ้ง ภายในคอลเล็กชันจะมีรูปภาพแสดงถึงกิจกรรมต่างๆ ของมนุษย์ในแต่ละวันที่ครอบคลุมกิจกรรมที่แตกต่างกันกว่า 410 กิจกรรมแต่ละภาพมีป้ายกำกับตามลำดับ ชุดข้อมูลประกอบด้วยรูปภาพที่แยกจากวิดีโอ YouTube พร้อมด้วยเฟรมก่อนหน้าและตามหลังที่ไม่มีคำอธิบายประกอบ


โดยภายในชุดข้อมูลนั้นจะมีรูปภาพ 25,000 ภาพแยกจากวิดีโอออนไลน์ที่มีข้อต่อร่างกายที่มีคำอธิบายประกอบ 40,000 ภาพ คลาสแบ่งแยกกว่า 410 คลาส เพื่อใช้ในกรณีประมาณท่าทางมนุษย์หรือการตรวจจับอุบัติเหตุ ที่สำคัญสามารถใช้งานได้ฟรีทั้งไม่ใช่เชิงพาณิชย์และเชิงพาณิชย์


10.CelebA

เป็นชุดข้อมูลขนาดใหญ่ที่มีภาพในคอลเล็กชันรูปภาพคนดังว่า 200,000 ภาพพร้อมกับคำอธิบายประกอบลักษณะ 40 รายการ รูปภาพแสดงท่าทาง พื้นหลัง และจำนวนที่หลากหลาย ที่ออกแบบมาเพื่อฝึกอบรมการจดจำและตรวจจับใบหน้า การแปลงจุดสังเกต และแก้ไข้หรือสังเคราะห์ใบหน้า


ภายในชุดจะมีรูปภาพมากกว่า 200,000 ภาพพร้อมคำอธิบายประกอบแอตทริบิวต์ 40 รายการ (10,177 ID เฉลี่ย 20 รูปต่อ ID พร้อมสถานที่สำคัญ 5 แห่ง) คลาส 10.177 คลาส แต่สามารถใช้งานเพื่อวัตถุประสงค์ในการวิจัยที่ไม่ใช่เชิงพาณิชย์เท่านั้น

ร่วมเเสดงความคิดเห็น :