site

Pemula AI Eropah berlumba-lumba untuk meningkatkan kemahiran bahasa chatbots

Syarikat permulaan Eropah berlumba-lumba untuk menyelesaikan masalah dengan chatbot kecerdasan buatan yang popular: kualiti respons dalam bahasa selain bahasa Inggeris.

Silo AI yang berpangkalan di Helsinki pada hari Rabu bersedia untuk melancarkan inisiatif untuk menyumbang kepada pembinaan model bahasa besar baharu, yang mendasari produk AI generatif seperti OpenAI’s ChatGPT dan Google’s Bard, dalam bahasa Eropah termasuk Sweden, Iceland, Norway dan Denmark.

Syarikat Finland itu menyertai kumpulan lain yang berusaha meningkatkan teknologi di sebalik chatbots, yang memberikan jawapan realistik kepada gesaan bertulis, dengan bahasa seperti Jerman, Ibrani dan Arab.

Langkah itu berlaku apabila syarikat di seluruh dunia mula menggunakan perisian AI yang dibina oleh orang seperti OpenAI dan Google yang disokong Microsoft, menyebabkan pengkritik menyatakan kebimbangan mengenai terlalu bergantung pada teknologi tertutup yang berkuasa yang dibina oleh sekumpulan kecil yang kebanyakannya peserta AS.

“Satu inisiatif Eropah perlu . . . menangkap pengetahuan daripada perspektif Eropah dan kami boleh mengawal jenis data yang dimasukkan ke dalamnya,” kata Peter Sarlin, ketua eksekutif Silo AI.

Bard Google pada masa ini hanya berfungsi dalam bahasa Inggeris. ChatGPT OpenAI menyokong berpuluh-puluh bahasa, termasuk bahasa Eropah, Hindi, Farsi dan lain-lain. Walau bagaimanapun, ia tidak sama tepat merentas semua bahasa, menurut mereka yang telah mengujinya secara meluas.

Silo AI sedang cuba menyelesaikan isu ini dengan mengumpulkan pasukan ahli akademik AI yang berpengalaman dari seluruh Eropah. Mereka akan membina, melatih dan mengendalikan model bahasa Scandinavia pada superkomputer LUMI yang paling berkuasa di benua itu, yang terletak di Finland dan telah diubah suai untuk menjalankan perisian AI generatif.

Inisiatif pasukan baharu itu, yang dikenali sebagai SiloGen, merancang untuk berkembang kepada lebih banyak bahasa dari semasa ke semasa.

Isunya bukan semata-mata linguistik, bagaimanapun. Mencipta model di Eropah boleh memastikan kualiti data yang digunakan untuk latihan mewakili budaya dan etika negara di luar AS, termasuk mengenai perkara privasi, kata Sarlin.

Model Silo AI juga akan menjadi sumber terbuka, bermakna ia boleh dianalisis dan disesuaikan oleh sesiapa sahaja yang ingin menggunakannya. Ini berbeza dengan OpenAI dan model tertutup Google, yang mana syarikat mungkin enggan berkongsi data sulit atau proprietari mereka.

Usaha Eropah lain termasuk OpenGPT-X dan LEAM, yang merupakan inisiatif yang diterajui Jerman untuk membangunkan model bahasa sumber terbuka. Model OpenGPT-X sedang dibina bersama dengan Aleph Alpha permulaan AI Jerman.

Apabila ia dilancarkan tahun lepas, kumpulan di sebalik OpenGPT-X memberi amaran bahawa kekurangan akses kepada butiran model seperti GPT-4 mengancam “kedaulatan digital dan kebebasan pasaran” Eropah dalam AI, yang mungkin menghalang pertumbuhan syarikat dan penyelidikan Eropah.

Marco Trombetti, ketua eksekutif syarikat terjemahan digital Itali Translated, berkata chatbot terkemuka telah diprogramkan untuk menyampaikan hasil terbaik mereka dalam bahasa Inggeris, yang “tidak adil kepada seluruh dunia”.

Untuk mengatasi masalah ini, syarikatnya telah mencipta alat terjemahan langsung untuk ChatGPT yang berfungsi dalam 60 bahasa dan bertujuan untuk menambah baik jawapan alat tersebut.

“Ia seperti lonjakan lima tahun ke belakang, dari segi teknologi, untuk dunia bukan berbahasa Inggeris, yang secara berkesan mewujudkan dunia dua kelajuan,” kata Trombetti mengenai alat AI generatif semasa.

Kebimbangan seperti itu bukan sahaja disuarakan di Eropah. Pihak Berkuasa Inovasi Israel membelanjakan Shk7.5 juta (kira-kira $2.1 juta) untuk mencipta Persatuan Pemprosesan Bahasa Semulajadi. Kumpulan itu cuba membalikkan “kualiti pengecaman pertuturan Ibrani dan Arab yang lemah dan tidak mencukupi dalam pelbagai jenis sistem berkomputer”, kata Dror Bin, ketua eksekutifnya.

Bin berkata dengan pembiayaan terhad untuk penyelidikan AI di negara berbahasa Arab dan penutur bahasa Ibrani yang agak sedikit di dunia, kebimbangan mereka akan ketinggalan kerana produk AI disepadukan ke dalam aplikasi komersial seperti Microsoft Office dan Google Workspace.

“Kualiti memahami dan mengiktiraf pertuturan manusia dalam bahasa Ibrani dan Arab adalah lebih rendah dan menjadi penghalang untuk merealisasikan dan menggunakan perkhidmatan lanjutan,” tambahnya.

Laporan tambahan oleh John Thornhill

resulsgp

pengluaran sdy

pengeluaran sydney

hongkong totobet

pengeluaran sgp hari ini