Google тайно насилует интеллект переводчиков
Google тайно насилует интеллект переводчиков. Шутка (все таки просмотр камеди клаба накладывает свой отпечаток). Но в этой шутке гораздо больше смысла чем может показаться на первый взгляд.
Давно хотел рассказать о том как работает система перевода текстов используемая поисковым гигантом. Ведь некоторые шедевры перевода от гугл стали уже притцей во языцах: “Piter Norton - Евгений Касперский”, “владимир - george”, “выкинуть диск в форточку - Jesus drive into wild”... При этом в целом, на больших текстах качество перевода весьма приемлемое.
В чем же дело?
Данный вопрос следует задать Питеру Норвигу официальная должность - director of machine learning, search quality and research. В частности, как специалист по искуственному интелекту, Питер работал над созданием “Гуглятора”.
Системы которая будет способна переводить тексты на любых известных языках. Причем главной задачей системы было не просто осуществлять дословный перевод (чем по сути занимаются все существующие программы перевода текста), а передавать смысловое значение текста. Как вы понимаете, разница между этими двумя подходами - колосальна.
Теоретически, это обозначает что Гугл будет способен понимать смысл фраз независимо от языка на котором была написана эта фраза, и соответственно это позволяет осуществлять перевод абсолютно любого языка, на другой язык с сохранением смысла..
Звучит невероятно, но алгоритм работы гуглятора довольно прост. Системе скармливается огромное количество текстов написанных на одном языке, и разные переводы этих текстов на других языках. Далее используя алгоритмы искуственного интелекта компьютер ищет связи между оригиналом и переводом. В результате чего получается некая универсальная модель языка в которой слова определяют не написание, а смысловые и ситуационные связи.
Как можно убедиться, данная концепция отлично работает и имеет большое будущее. Но, как и любой другой системе искуственного интелекта, гуглятору вначале необходимо набрать большее количество информации и немного подучиться. Иначе список “перлов” от гугл транслятора будет непрерывно пополняться.
