เครื่องจักร Alexa เป็นซอฟต์แวร์ รู้จำเสียงพูดบนคลาวด์ ของอเมซอน ซึ่งเป็นเสียงก้อง ของลำโพงทรงกระบอกสีดำ การปรากฏตัวของ Alexa ทำให้เกิดความรู้สึกในโลกนี้ ยกเว้นสำหรับเด็ก เด็กๆจะเติบโตมาพร้อมกับ Alexa ด้วยการสนับสนุน ของปัญญาประดิษฐ์ Alexa ได้เรียนรู้ที่จะตอบคำถามมากขึ้นเรื่อยๆ และวันหนึ่งอาจมีวิวัฒนาการ ไปถึงจุดที่สามารถพูดคุย กับผู้คนได้อย่างอิสระ
อย่างไรก็ตาม ใครก็ตาม ที่อายุเกิน 10 ปี รู้ดีว่าก่อนหน้านี้ ไม่เป็นเช่นนั้น การพัฒนาซอฟต์แวร์ การรู้จำเสียงพูดมาไกลมาก แม้ว่าเสียงสะท้อน จะบางกว่าแก้วเบียร์ แต่เครื่องรู้จำคำพูดเครื่องแรก ซึ่งพัฒนาขึ้นในช่วงกลางศตวรรษที่ยี่สิบ สามารถเติมให้เต็มห้องได้เกือบทั้งห้อง แอมะซอน เอคโค่ นำการจดจำเสียงมาสู่ห้องนั่งเล่นของผู้คน
มนุษย์พยายามคุย กับเครื่องจักรมานานแล้ว หรืออย่างน้อยก็ให้พวกเขาคุยกับเรา จอริต ฟาน เดอร์ มูเลนกล่าวว่า เสียงช่วยให้เราสามารถโต้ตอบ กับ”เครื่องจักร”ได้ง่ายอย่างไม่น่าเชื่อ มันเป็นวิธีการโต้ตอบ ที่เป็นธรรมชาติและสะดวกที่สุด และยังเป็นสิ่งที่เราใช้ทุกวันอีกด้วยจอริต ฟาน เดอร์ มูเลน กล่าว เสียงคืออนาคต ในปี ค.ศ. 1773
คริสเตียน นักวิทยาศาสตร์ชาวรัสเซีย และศาสตราจารย์ ด้านสรีรวิทยา ที่อาศัยอยู่ในโคเปนเฮเกน เริ่มคิดเกี่ยวกับเทคโนโลยีการพูด เขาสร้างอุปกรณ์พิเศษ ที่เชื่อมต่อท่อเรโซแนนซ์ กับท่อออร์แกน เพื่อสร้างเสียงที่คล้าย กับสระในภาษามนุษย์ เพียงหนึ่งทศวรรษต่อมา โวล์ฟกัง ฟอน เคมเปเลน แห่งเวียนนาได้สร้างเครื่องพูดด้วยเสียง แบบกลไกที่คล้ายกัน
ในช่วงต้นศตวรรษที่ 19 นักประดิษฐ์ชาวอังกฤษ ชาร์ลส์ วีตสโตน ได้ปรับปรุงระบบ von Kempelen ด้วยเครื่องสะท้อนเสียงจากหนัง ระบบสามารถปรับ หรือควบคุมด้วยตนเอง เพื่อให้เสียงเหมือนภาษา ในปี ค.ศ. 1881 อเล็กซานเดอร์ เกรแฮม เบลล์และชาร์ลส์ ซัมเนอร์ เทนเทอร์น้องชายของเขา ได้สร้างกระบอกหมุนที่เคลือบด้วยขี้ผึ้ง
ซึ่งเป็นกระบอกเสียงเดี่ยว เพื่อตอบสนองต่อแรงดันเสียงที่เข้ามา ร่องแนวตั้งถูกตัดออก การประดิษฐ์นี้ เป็นการปูทางให้แผ่นเสียงเครื่องแรก ได้รับการจดสิทธิบัตรในปี พ.ศ. 2450 พวกเขาหวังว่าจะใช้เครื่องจักร ในการบอกโน้ต และตัวอักษร ที่อ่านโดยเลขานุการ เพื่อไม่ให้มีนักชวเลขอีกต่อไป ต่อมาสามารถพิมพ์บันทึกเหล่านี้ ด้วยเครื่องพิมพ์ดีด
สิ่งประดิษฐ์นี้ ได้รับความนิยมอย่างรวดเร็วทั่วโลก ในสำนักงาน เลขานุการ จะสวมหูฟัง เพื่อฟังการบันทึก และการถอดเสียงที่สมบูรณ์ แต่ต้นแบบทั้งหมดเหล่านี้ เป็นเครื่องจักรแบบพาสซีฟ จนกระทั่งมีเครื่องระบุตัวตนแบบดิจิทัลอัตโนมัติ ออเดรย์ ในปี 1952 มันถูกสร้างขึ้นโดย Bell Labs มันใหญ่มาก ใช้ชั้นวางรีเลย์สูง 6 ฟุต กินไฟมาก และเชื่อมต่อกับสายเคเบิลจำนวนมาก สามารถรับรู้หน่วยพื้นฐานของเสียงพูดได้
ในขณะนั้นระบบคอมพิวเตอร์ มีราคาแพงและหนักมาก โดยมีพื้นที่จัดเก็บ และความเร็ว ในการประมวลผลที่จำกัด แต่ออเดรย์ ยังคงสามารถจดจำการออกเสียงตัวเลข จากศูนย์ถึงเก้า ได้ด้วยอัตราความแม่นยำ 90 เปอร์เซ็นต์ อย่างน้อยก็เมื่อ HK Davis ผู้พัฒนาของบริษัทออกเสียง เมื่อต้องเผชิญกับลำโพงที่กำหนดอื่นๆ อัตราความแม่นยำอยู่ที่ 70 ถึง 80 เปอร์เซ็นต์
แต่ถ้าเป็นเสียงที่ไม่คุ้นเคย อัตราความแม่นยำจะลดลงอย่างมาก นี่เป็นความสำเร็จ ที่น่าอัศจรรย์ในขณะนั้น แต่ระบบนั้นต้องใช้ทั้งห้องข องอุปกรณ์อิเล็กทรอนิกส์ และวงจรพิเศษ เพื่อรับรู้หมายเลขเดียว จากแผนกวิเคราะห์ข้อมูล ของห้องปฏิบัติการ
เนื่องจากออเดรย์ สามารถรับรู้เฉพาะเสียง ของลำโพงที่กำหนด การใช้งานจึงถูกจำกัด ตัวอย่างเช่น สามารถให้ฟังก์ชันการโทรด้วยเสียง สำหรับผู้ให้บริการโทรศัพท์สาธารณะ แต่จริงๆแล้ว ไม่จำเป็นเพราะในกรณีส่วนใหญ่ การโทรจะทำผ่านปุ่มแบบแมนนวล ค่าใช้จ่ายและง่ายขึ้น ออเดรย์ ยังคงอยู่ในรูปของตัวอ่อน ซึ่งล้ำหน้ากว่าคอมพิวเตอร์ทั่วไป แม้ว่าจะไม่ได้ใช้ในระบบการผลิต แต่ก็แสดงให้เห็นว่า การรู้จำเสียงทำได้สำเร็จ บาฮาร์กล่าว
บทความอื่นที่น่าสนใจ ➠ คอหอย อักเสบเรื้อรังอันตรายจากโรคส่งผลด้านใดบ้าง