2024-04-25 09:31:48
จากการมาของเทคโนโลยี AI ที่เข้ามามีบทบาทสำคัญในการช่วยอำนวยความสะดวกในชีวิตมากขึ้น ซึ่งกว่าเทคโนโลยีนี้จะสามารถในการประมวลผลอย่างชำนาญนั้นจะมีการฝึกอบรมอัลกอริทึมจากชุดข้อมูลที่มีคุณภาพสูงมากมายเพื่อให้สามารถจำแนกและวิเคราะห์ได้อยากถูกต้อง ในปัจจุบันมีคอลเล็กชันชุดข้อมูลที่มีคุณภาพมากมายที่สามารถฝึกให้ AI นั้นสามารถทำงานได้อย่างมีประสิทธิภาพอยู่ 10 อันดับได้แก่
1.Microsoft COCO
เป็นชุดข้อมูลที่ได้รับการยกย่องว่าเป็นมาตรฐานในชุมชนนักพัฒนา ซึ่งข้อมูลภายในคอลเล็กชันครอบคลุมรูปภาพที่มีป้ายกำกับจำนวนมาก โดยออกแบบมาเพื่ออำนวยความสะดวกในการวิจัยเกี่ยวกับการจดจำวัตถุ การแบ่งส่วน และคำบรรยายภาพ เป็นการก้าวข้ามขอบเขตของความเข้าใจด้วยภาพและส่งเสริมนวัตกรรมในอัลกอริทึมการมองเห็นของคอมพิวเตอร์
โดยภายในชุดข้อมูลนั้นรูปภาพ 330K (มีป้ายกำกับ>200K) พร้อมคำบรรยาย 5 รายการต่อรูปภาพ ชุดข้อมูลประกอบด้วยอินสแตนซ์ออบเจ็กต์ 1.5 ล้านรายการ และบุคคล 250,000 คนพร้อมประเด็นสำคัญ มีคลาสกว่า 80 คลาส สามารถนำมาใช้งานในการแบ่งส่วนวัตถุ และการจดจำวัตถุต่าง ๆ สามารถใช้งานได้ทั้งวัตถุประสงค์ทางการค้าและการวิจัย
2.CIFAR-10 และCIFAR-100
ชุดข้อมูลนี้ย่อมาจากCanadian Institute For Advanced Research เป็นชุดข้อมูลที่ประกอบด้วยคอลเล็กชันรูปภาพที่หลากหลายซึ่งรวบรวมไวเพื่อฝึกอบรมเรียนรู้ของMachine learning และอัลกอริทึมการมองเห็นของคอมพิวเตอร์โดยเฉพาะ ถือว่าเป็นอีกหนึ่งชุดข้อมูลที่มีคุณภาพและใช้งานกันอย่างแพร่หลาย
โดยมีหน้าที่ที่เป็นเกณฑ์มาตรฐานสำหรับการทดลองและการประเมินผลมากมาย ใช้ในการจำแนกภาพ ภายในชุดข้อมูลมีภาพสี 60,000 ภาพ (32x32 พิกเซล) แบ่งออกเป็นชุดฝึกอบรม 50,000 ชุดและชุดย่อยการทดสอบ 10,000 ชุด ชุดข้อมูลประกอบด้วย 6,000 รูปภาพต่อชั้นเรียน โดยCIFAR-10 และCIFAR-100 จะแตกต่างกันที่จำนวนคลาสที่ CIFAR-10 จะมีอยู่ 10 คลาส และCIFAR-100 มีอยู่ 100 คลาส
3.ImageNet
เป็นขุดข้อมูลขนาดใหญ่ที่เปลี่ยนแปลงขอบเขตการมองเห็นของ AI ด้วยข้อมูลภายในชุดเป็นภาพที่มีป้ากำกับมากกว่า 14 ล้านภาพซึ่งครอบคลุมในแต่ละหมวดหมู่วัตถุกว่า 1000 หมวด และด้วยขนาดของชุดข้อมูลขนาดใหญ่ทำให้สามารถเป็นทรัพยากรพัฒนาการจำแนกภาพ การตรวจจับวัตถุ และงานทำความเข้าใจภาพ
ImageNet Large Scale Visual Recognition Challenge (ILSVRC) ได้กลายเป็นชุดย่อยที่ได้รับความนิยมมากที่สุดซึ่งประกอบด้วยการฝึกอบรม 1.3M, การตรวจสอบความถูกต้อง 50,000 ภาพ และภาพทดสอบ 100,000 ภาพ แต่ชุดข้อมูลนี้ไม่สามารถใช้งานได้ในเชิงพาณิชย์
4.YouTube-8M
เป็นชุดข้อมูลเพื่อการจัดหมวดหมู่รูปภาพในวิดีโอ การจดจำการกระทำ การจัดหมวดหมู่วิดีโอ โดยตัวชุดข้อมูลมีID วิดีโอ 6.1M, วิดีโอ 350,000 ชั่วโมง วิดีโอประกอบด้วยคุณสมบัติภาพและเสียง 2.6 พันล้านรายการ ชุดข้อมูลนำเสนอ ซึ่งคอลเล็กชันที่ครอบคลุมที่ช่วยให้นักวิจัยสามารถจัดการงานต่างๆ เช่น การจัดหมวดหมู่วิดีโอ การสรุปวิดีโอ และการแนะนำเนื้อหา ขนาดอันมหาศาลและความหลากหลายที่หลากหลายของชุดข้อมูลนี้ทำให้เป็นทรัพย์สินอันล้ำค่าสำหรับการพัฒนาและฝึกอบรมโมเดลการเรียนรู้เชิงลึก
โดยชุดข้อมูลนี้สามารถใช้ในเชิงพาณิชย์ การดัดแปลง การจัดจำหน่าย การใช้สิทธิบัตร การใช้ส่วนตัว
5.IMDB-WIKI
ชุดข้อมูลสำหรับนักวิจัยและนักพัฒนาที่ใช้ในการจดจำใบหน้าและการคาดการณ์อายุ โดยข้อมูลชุดนี้รวบรวมรูปภาพจาก IMBb และ Wikipedia ทำให้ชุดข้อมูลนี้มีคอลเล็กชันรูปภาพใบหน้าที่มีป้ายกำกับอายุ เพศ จำนวนมากและมีข้อมูลประชากรหลากหลาย
โดยชุดข้อมูลประกอบไปด้วยรูปภาพมากกว่า 500,000 ภาพพร้อมป้ายกำกับอายุและเพศ และมีคลาสกว่าพันคลาส สามารถนำไปใช้งานที่ไม่ใช่เชิงพาณิชย์เท่านั้น
6.CityScapes
เป็นชุดข้อมูลที่ออกแบบมาเพื่อประเมินประสิทธิภาพอัลกอริทึมการมองเห็นให้สามารถทำความเข้าใจในฉากเมืองได้ มีการสนับสนุนการวิจัยที่ใช้งานข้อมูลที่มีคำอธิบายประกอบและข้อมูลที่ไม่ชัดเจนที่ใช้ในการฝึกโมเดล AI ข้อมูลประกอบด้วยลำดับวิดีโอสเตอริโอที่หลากหลายที่บันทึกในฉากท้องถนนจาก50 เมืองพร้อมคำอธิบายประกอบระดับพิกเซลสำหรับ 5,000 เฟรมและคำอธิบายประกอบที่ไม่ชัดเจนเพิ่มเติมสำหรับ 20,000เฟรม
โดยภายในชุดข้อมูลกว่า 50 เมือง รูปภาพกว่า 25,000 ภาพ คลาสจำนวน 30 คลาส สามารถใช้ในการฝึกสอนทำความเข้าใจฉากเมืองโดยนำไปใช้งานได้โดยโมเดลนั้นไม่ใช่เชิงพาณิชย์
7. Fashion-MNIST
ชุดข้อมูลเสื้อผ้าแฟชั่นที่สร้างขึ้นโดย Zelando ที่ประกอบไปด้วยรูปภาพเสื้อผ้าสีขาวดำกว่า 70,000 ภาพภายในคอลเล็กชัน ซึ่งได้รับการออกแบบมาเพื่อทดแทนชุดข้อมูล MNIST ตั้งเดิมเพื่อช่วยนักวิจัยสามารถเปรียบเทียบอัลกอริทึมการเรียนรู้เครื่องโดยใช้ขนาดรูปภาพและการแยกฝึกอบรมและการทดสอบที่เท่ากับ Zalando โดยมีเป้าหมายที่จะมาแทนชุดข้อมูล MNIST
ภายในคอลเล็กชันนี้จะมีภาพระดับสีเทา 70,000 ภาพ (28x28 พิกเซล) คลาส 10 คลาสที่ออกแบบมาใช้กับการจัดหมวดหมู่รูปภาพ สามารถใช้งานได้ทั้งเชิงพาณิชย์และไม่ใช่เชิงพาณิชย์
8.MNIST
เป็นชุดฐานข้อมูลตัวเลขที่มีการเขียนด้วยลายมือ ภายในชุดจะมีชุดฝึกอบรม 60,000 ตัวอย่างและ 10,000 ตัวอย่าง เป็นชุดย่อยของชุดที่ใหญ่กว่าจาก NIST ตัวเลขได้รับการปรับขนาดให้เป็นมาตรฐานและจัดให้อยู่กึ่งกลางของรูปภาพที่มีขนาดคงที่ ออกแบบมาเพื่อเป็นฐานข้อมูลสำหรับลองใช้เทคนิคการเรียนรู้และวิธีการจดจำรูปแบบจากข้อมูลในโลกแห่งความเป็นจริง
โดยภายในชุดจะมีภาพสีขาวดำ 70,000 ภาพ (28x28 พิกเซล) แบ่งออกเป็นชุดฝึกอบรม 60,000 ชุดและชุดย่อยการทดสอบ 10,000 ชุด คลาส 10 คลาสที่ใช้งานในการรู้จำลายมือ การจัดหมวดหมู่รูปภาพ สามารถใช้งานได้ทั้งเชิงพาณิชย์และไม่ใช่เชิงพาณิชย์
9.MPII Human Pose
ชุดข้อมูลเป็นเกณฑ์มาตรฐานชั้นนำสำหรับการประเมินการประมาณท่าทางของมนุษย์แบบชัดแจ้ง ภายในคอลเล็กชันจะมีรูปภาพแสดงถึงกิจกรรมต่างๆ ของมนุษย์ในแต่ละวันที่ครอบคลุมกิจกรรมที่แตกต่างกันกว่า 410 กิจกรรมแต่ละภาพมีป้ายกำกับตามลำดับ ชุดข้อมูลประกอบด้วยรูปภาพที่แยกจากวิดีโอ YouTube พร้อมด้วยเฟรมก่อนหน้าและตามหลังที่ไม่มีคำอธิบายประกอบ
โดยภายในชุดข้อมูลนั้นจะมีรูปภาพ 25,000 ภาพแยกจากวิดีโอออนไลน์ที่มีข้อต่อร่างกายที่มีคำอธิบายประกอบ 40,000 ภาพ คลาสแบ่งแยกกว่า 410 คลาส เพื่อใช้ในกรณีประมาณท่าทางมนุษย์หรือการตรวจจับอุบัติเหตุ ที่สำคัญสามารถใช้งานได้ฟรีทั้งไม่ใช่เชิงพาณิชย์และเชิงพาณิชย์
10.CelebA
เป็นชุดข้อมูลขนาดใหญ่ที่มีภาพในคอลเล็กชันรูปภาพคนดังว่า 200,000 ภาพพร้อมกับคำอธิบายประกอบลักษณะ 40 รายการ รูปภาพแสดงท่าทาง พื้นหลัง และจำนวนที่หลากหลาย ที่ออกแบบมาเพื่อฝึกอบรมการจดจำและตรวจจับใบหน้า การแปลงจุดสังเกต และแก้ไข้หรือสังเคราะห์ใบหน้า
ภายในชุดจะมีรูปภาพมากกว่า 200,000 ภาพพร้อมคำอธิบายประกอบแอตทริบิวต์ 40 รายการ (10,177 ID เฉลี่ย 20 รูปต่อ ID พร้อมสถานที่สำคัญ 5 แห่ง) คลาส 10.177 คลาส แต่สามารถใช้งานเพื่อวัตถุประสงค์ในการวิจัยที่ไม่ใช่เชิงพาณิชย์เท่านั้น
2024-06-10 03:19:31
2024-05-31 03:06:49
2024-05-28 03:09:25
2024-05-24 11:26:00
บทความที่น่าสนใจอื่นๆยังมีอีกมากลองเลืือกดูจากด้านล่างนี้ได้นะครับ
2023-10-12 05:42:28
2024-03-18 02:27:20
2024-11-06 11:31:16
2023-11-23 01:36:57
2024-03-27 04:49:48
2024-08-26 09:23:42
2024-03-18 04:29:28
2023-09-05 11:48:53
2023-10-02 05:48:51