วิธีที่อเมซอนต้องการลดช่องว่างด้านวิทยาศาสตร์ข้อมูลโดยนำการเรียนรู้ของเครื่องไปยังคลาวด์

ธุรกิจต่างๆกำลังมองหาวิธีเพิ่มกำไรของพวกเขามากขึ้นโดยการขุดข้อมูลที่พวกเขารวบรวม

แต่มันเป็นเรื่องยากสำหรับ บริษัท ที่จะดึงข้อมูลที่มีความหมายเมื่อนักวิทยาศาสตร์ข้อมูลขาดแคลน

เพื่อตอบสนองต่อความขาดแคลนทักษะนี้ผู้ให้บริการคลาวด์รายใหญ่ได้จัดตั้งบริการตามความต้องการเพื่อให้ธุรกิจมีโอกาสเริ่มต้นด้วยการเรียนรู้ของเครื่อง

การเรียนรู้ของเครื่องเป็นเทคนิคที่ช่วยให้คอมพิวเตอร์มองหารูปแบบในข้อมูลและให้พลังกับเครื่องมือแนะนำออนไลน์ที่แนะนำหนังสือหรือภาพยนตร์ที่คุณอาจชอบ บริษัท ต่างๆสามารถใช้แบบจำลองการเรียนรู้ของเครื่องเพื่อคาดการณ์ที่มีประโยชน์เช่น 'อีเมลนี้เป็นจดหมายขยะหรือไม่' หรือ 'คาดว่าจะจำหน่ายสินค้าในภูมิภาคนี้กี่รายการ?'

ผู้จัดการทั่วไป AWS สำหรับวิทยาศาสตร์ข้อมูล Matt Wood ภาพ: Amazon

Amazon, Microsoft และ Google ให้บริการการเรียนรู้แบบออนดีมานด์ผ่านแพลตฟอร์มคลาวด์ที่เกี่ยวข้องแต่ละแห่งมีระดับการเข้าถึงที่แตกต่างกันสำหรับนักพัฒนาโดยไม่มีพื้นฐานด้านสถิติ

อเมซอนใช้การเรียนรู้ของเครื่องมาตั้งแต่สมัยเริ่มแรกในฐานะผู้ขายหนังสือออนไลน์เมื่อต้องการวิธีที่จะช่วยให้บรรณาธิการของมนุษย์เลือกคำแนะนำจากห้องสมุดที่แข็งแกร่งหนึ่งล้านแห่ง

“ เราตัดสินใจตั้งแต่เนิ่นๆเนื่องจากองค์กรที่การเรียนรู้ของเครื่องจักรนั้นมีความสำคัญเมื่อธุรกิจของเราเติบโตขึ้น” แมตต์วู้ดผู้จัดการทั่วไปฝ่ายข้อมูลวิทยาศาสตร์ของ Amazon Web Services (AWS) กล่าว

"เรามีการตัดสินใจที่จะทำให้เราต้องการที่จะออกไปและจ้างผู้เชี่ยวชาญด้านการเรียนรู้เครื่องและผู้เชี่ยวชาญเมื่อพวกเขาและเด็กผู้หญิงเหล่านั้นหายากมาก? การออกแบบอัลกอริธึม "

อเมซอนจึงตัดสินใจว่าจ้างกลุ่มผู้เชี่ยวชาญด้านการเรียนรู้เครื่องค่อนข้างเล็กเพื่อสร้างบริการภายในที่นักพัฒนาทั้งหมดสามารถใช้

“ เราเห็นความสามารถด้านนวัตกรรมนี้เพราะนักพัฒนาไม่จำเป็นต้องใช้เวลามากมายในการเรียนรู้เครื่องจักรเพื่อใช้ประโยชน์จากการใช้งาน” เขากล่าวโดยอ้างถึงบทบาทของบริการในด้านต่าง ๆ เช่นการเติมเต็มความจุ การวางแผนการจัดการห่วงโซ่อุปทานและการระบุสินค้าปลอม

บริการการเรียนรู้เครื่องสาธารณะที่นำเสนอโดย AWS วันนี้ขึ้นอยู่กับอัลกอริทึมเดียวกันกับที่ บริษัท ให้บริการแก่พนักงานภายในองค์กร ลูกค้าสามารถสร้างแบบจำลองการเรียนรู้ของเครื่องโดยใช้ข้อมูลที่เก็บไว้ใน Relational Data Service ของ Amazon ด้วยแบ็กเอนด์ MySQL, ที่เก็บวัตถุ S3 หรือบริการคลังข้อมูล Redshift เพื่อฝึกอบรมพวกเขา

แบบจำลองเหล่านี้สามารถใช้ในการทำนายประเภทต่างๆ การจำแนกประเภทไบนารีใช้เพื่อทำนายผลลัพธ์ที่เป็นไปได้หนึ่งในสอง - 'อีเมลนี้เป็นสแปมหรือไม่' การจำแนกประเภทหลายชั้นเพื่อคาดการณ์ผลลัพธ์ที่เป็นไปได้หนึ่งในสามหรือมากกว่าและความน่าจะเป็นของแต่ละคน - 'ผลิตภัณฑ์นี้เป็นหนังสือภาพยนตร์หรือบทความเสื้อผ้าหรือไม่' การถดถอยใช้เพื่อคาดการณ์จำนวน - 'อุณหภูมิในวันพรุ่งนี้เป็นอย่างไร?'

บริการจะพยายามตรวจสอบความถูกต้องของข้อมูลโดยอัตโนมัติและหากเป็นไปได้ให้แปลงเป็นรูปแบบที่มีประโยชน์มากขึ้นตัวอย่างเช่นการดึงรหัสไปรษณีย์หรือรหัสไปรษณีย์จากที่อยู่

เมื่อโมเดลถูกสร้างขึ้นแล้วนักพัฒนาสามารถเข้าถึงโมเดลได้ผ่านทางคอนโซล AWS หรือการเรียก API ทำให้สามารถคาดการณ์การป้อนเข้าแอพหรือบริการออนไลน์ได้ สามารถปรับโมเดลได้อย่างละเอียดโดยใช้แถบเลื่อนในคอนโซล

“ นักพัฒนาจำเป็นต้องรู้เกี่ยวกับการเรียนรู้ของเครื่องจักรน้อยมากการเรียนรู้ของเครื่องได้รับการจัดการโดยบริการ” Wood กล่าว

บริการบนคลาวด์เช่นนี้ช่วยลดความยากลำบากในการทดสอบด้วยการเรียนรู้ของเครื่องจักรลดเวลาและเงินที่จำเป็นในการเรียนรู้ทักษะในการเริ่มต้นเขากล่าว

Amazon ทดสอบว่าบริการง่ายขึ้นมากเพียงใดสำหรับนักพัฒนาในการเริ่มต้นใช้งานการเรียนรู้ของเครื่องโดยมอบหมายให้นักพัฒนาสองคนที่ไม่มีพื้นฐานการเรียนรู้ของเครื่องเพื่อสร้างแบบจำลองสำหรับทำนายเพศของบุคคลจากชื่อแรกของพวกเขา

นักพัฒนาใช้เวลาหนึ่งเดือนในการสร้างแบบจำลองของพวกเขาซึ่งผ่านการฝึกอบรมโดยใช้ข้อมูลสำมะโนประชากรและทำนายเพศด้วยความแม่นยำร้อยละ 92 ในทางตรงกันข้ามมันต้องใช้นักพัฒนาที่ไม่มีความรู้ในการเรียนรู้ด้วยเครื่องจักร 20 นาทีในการสร้างแบบจำลองเดียวกันด้วยความแม่นยำในการทำนายที่เหมือนกันโดยใช้บริการของ Amazon

ไม่ได้บอกว่าบริการคลาวด์เหล่านี้เหมาะสมกับความต้องการการเรียนรู้ของเครื่องทุกคน

สำหรับหนึ่งในขณะที่พวกเขาอาจลดต้นทุนในการเริ่มต้นพวกเขาอาจมีราคาแพงที่จะใช้ในระยะยาว บริการของ Amazon สามารถเสียค่าใช้จ่ายในภูมิภาคประมาณ $ 100 ต่อการคาดการณ์หนึ่งล้าน

ดังที่ผู้ประกอบการรายหนึ่งกล่าวว่า: "นี่เป็นสิ่งที่ดีมากที่จะใช้เมื่อเริ่มต้นใช้งาน แต่มันก็คุ้มค่าที่ต้องห้ามแม้แต่ในงบประมาณที่มีขนาดใหญ่มาก"

บริการดังกล่าวยังได้วิจารณ์สำหรับผู้ใช้ที่ล็อคด้วยบริการที่ไม่อนุญาตให้ผู้ใช้ส่งออกและนำเข้าโมเดล

"ฉันไม่เห็นว่า บริษัท ใดที่มีความรู้สึกกังวลจะล็อคโมเดลการคาดการณ์ลงใน AWS" ในฐานะผู้ใช้รายหนึ่งในฟอรัมนักพัฒนา Hacker News กล่าว

ทั้งๆที่มีการวิพากษ์วิจารณ์การให้บริการที่มีประสบการณ์เหล่านี้ไม้เชื่อว่ามันจะนำไปสู่การทดลองที่มากขึ้นด้วยการเรียนรู้เครื่องจักรที่ บริษัท ต่างๆ

"กุญแจสำคัญสำหรับฉันคือประสิทธิภาพและทำให้ผู้พัฒนามั่นใจว่าสามารถเข้าถึงสิ่งนี้ได้"

© Copyright 2020 | mobilegn.com