miumau: (Default)
[personal profile] miumau
Еще один вопрос, который я (уже больше ради любопытства) задаю раз в 10 лет. Родилась ли за это время программа, способная слушать человеческую речь, и записывать услышанное в текстовый файл? Т.е. нормальное распознавание речи, комбинированное со способностью переписать ее в сносный текст?
Помнится, была некая команда разработчиков (кажется русских), которые пытались создать такой софт. Очень отчаянно пытались, и очень старательно продвигали результат. Но пользоваться этим было невозможно. Помимо того, что с половиной железа оно не сотрудничало, оно таки ничегошеньки не распознавало, и писало с тремя ошибкам в каждом слове. Но они довольно долго пытались. я когда-то примерно раз в три года такое искала, и все время они всплывали. Теперь я забыла, как их звали...

А кто знает, чем кончилось?

Научились русскую речь распознавать и записывать? А немецкую? А английскую?

А наоборот научились? Т.е. есть ли программа, которой можно скормить каких-нибудь сколько-то страниц текста, и чтобы оно ее более или менее сносно зачитало голосом?

А то смарофоны кругом, уже мечты о видеозвонках и прочих футуристичных штуках сбылись по сто раз, а это - все никак. :-)
Page 1 of 3 << [1] [2] [3] >>

Date: 2014-05-27 12:19 pm (UTC)
From: [identity profile] garry-samara.livejournal.com
https://dictation.io/

Вот тут все.

Date: 2014-05-27 12:19 pm (UTC)
From: [identity profile] lenat9.livejournal.com
вот и мне интересно

Date: 2014-05-27 04:11 pm (UTC)
From: [identity profile] Евгений Ба (from livejournal.com)
механически, без акцентов, русский текст винда читала лет десять назад.
Акценты (ударения, паузы) расставлялись значками по тексту.
Распознавание голоса винда делает сегодня (в штатной поставке нет русского варианта).

Специализированный софт эти задачи решает на пять
Поищите питерскую фирму "речевые технологии"
Вот статья про них на хабре
http://habrahabr.ru/company/speechpro/blog/205880/

Date: 2014-05-27 12:21 pm (UTC)
From: [identity profile] dolor-m.livejournal.com
я тоже весь институт о таком мечтала. потому что записывала на диктофон некоторые лекции. говорящие программки точнно есть, могу узнать у слабовидящей подруги

Date: 2014-05-27 12:21 pm (UTC)
From: [identity profile] koseroh.livejournal.com
Голосовой поиск в Интернет и голосовое управление в Андроиде работает более-менее корректно. Без пунктуации, конечно.

https://support.google.com/websearch/answer/2940021?hl=ru

Date: 2014-05-27 12:23 pm (UTC)
From: [identity profile] maria-mvs.livejournal.com
Читалки есть. Только там с ударениями плохо. По крайней мере, на русском)
Наоборот - тоже есть, но оно долго настраивается на дикцию конкретного человека (если человек внятно говорит, а если невнятно - капец вообще). Быстрее так набрать, чесслово.

Date: 2014-05-27 12:24 pm (UTC)
From: [identity profile] walter white (from livejournal.com)
lonely_warri0r написал мне 10 минут назад программа читалка:
Самописное творение могу только предложить:
synxronica .com/microblogerru/install/reader.exe

К программе отдельно ставить модуль нужно, например HRVoice: microbloger.ru/rhvoice.php

Голос рекомендую "Елену"

Date: 2014-05-27 12:24 pm (UTC)
From: [identity profile] shurshick.livejournal.com
Прога, по-моему, называлась "Горыныч". Что с ней сейчас - не знаю. Надо погуглить. :)

Date: 2014-05-27 01:01 pm (UTC)
From: [identity profile] mu-mla.livejournal.com
она самая. я где то с год-два назад тоже задалась таким вопросом как Миу, потому как помню первые разработки Горыныча. Увы все осталось на том же уровне...

(no subject)

From: [identity profile] capsolo.livejournal.com - Date: 2014-05-27 03:23 pm (UTC) - Expand

(no subject)

From: [identity profile] mobilemedved.livejournal.com - Date: 2014-05-27 04:23 pm (UTC) - Expand

, ли

Date: 2014-05-27 12:24 pm (UTC)
From: [identity profile] kirik.livejournal.com
мой кум регулярно, собираясь ехать куда-то далеко, берет с собой либо аудиокниги, либо текстовые исполнения любимых книг, которые специальная программа ему читает. сам слышал. получается сносно. ну, не Смоктуновский, естественно, и даже не Ярмольник, но на уровне Эмилии Спивак и без театральных пауз и акцентов.

Date: 2014-05-27 12:27 pm (UTC)
From: [identity profile] raven-oscar.livejournal.com
распознание речи это продукты Нюанса (известного по сири от apple). от них была открытая софтина - Dragonfly (по сути библиоткеа для разработки) и коммерческий dragon. демонстрация очень впечатляет. Язык - английский.

обратный процесс - если скормить в гугл переводчик страницу текста то он ее прочитает очень даже неплохо... и при желании - отдаст mp3 =)

Date: 2014-05-27 12:30 pm (UTC)
From: [personal profile] vadim_from_ampf
В xирургическом праксисе в нашем райцентре доктор надиктовывал текст на компьютер. По-немецки, естественно. Как называется софтина не рассмотрел , к сожалению.
Edited Date: 2014-05-27 12:32 pm (UTC)

Date: 2014-05-27 12:32 pm (UTC)
From: [identity profile] wweirdoo.livejournal.com
я сама не пробовала(мопед не мой) , но вроде если загрузить свое видео в ютьюб и потом нажать кнопку "текст видео", то реалльно получить текствый файл. С погрешностями, конечно, но тем не менее.
Я думаю если есть софтина для Хокинга, которая по начальным движениям/буквам распознает смысл- то такую, про котору спрашивают, тоже реально создать или уже есть что то

Date: 2014-05-27 12:33 pm (UTC)
From: [identity profile] wasilisa.livejournal.com
Не-а, не родилась пока слушающая и записывающая программа. :) И я надеюсь, что пока я жива, ничего такого хорошо работающего никто не придумает, а то без работы останусь я.

Date: 2014-05-27 04:11 pm (UTC)
From: [identity profile] happy-pelment.livejournal.com
Боюсь вас разочаровывать, но такие программы есть... :)

(no subject)

From: [identity profile] wasilisa.livejournal.com - Date: 2014-05-27 04:32 pm (UTC) - Expand

(no subject)

From: [identity profile] happy-pelment.livejournal.com - Date: 2014-05-27 05:44 pm (UTC) - Expand

(no subject)

From: [identity profile] u-dekka.livejournal.com - Date: 2014-05-27 05:52 pm (UTC) - Expand

(no subject)

From: [identity profile] wasilisa.livejournal.com - Date: 2014-05-27 06:15 pm (UTC) - Expand

Date: 2014-05-27 12:36 pm (UTC)
From: [identity profile] pavelcorsun.livejournal.com
Я пользуюсь Dragon Dictation на мобилке - нормально распознает.
Там много языков, включая русский.

Date: 2014-05-27 12:41 pm (UTC)
From: [identity profile] valentyna.livejournal.com
у меня есть друзья-колясочники, которые даже рукой пошевелить не могут и на компе работают голосом.
правда я ни разу еще не присутствовала, не знаю как это у них идет. но получается все, письма пишут, даже программируют голосом.

Date: 2014-05-27 12:43 pm (UTC)
From: [identity profile] aila0203.livejournal.com
Уже есть. Из того, что я знаю - такая программа существует.
Хороший знакомый общается со мной при ее помощи, когда руки у него заняты другим. Он говорит, а программа записывает. На русском. Но с ошибками. Ею можно пользоваться только если не срочно нужен текст, поскольку нужно время для проверки и исправления ошибок.
Если нужно - могу спросить что за программа и на чем установлена.

Date: 2014-05-27 12:46 pm (UTC)
From: [identity profile] intezza.livejournal.com
Ну... Для сносного чтения (русского там конечно нет), можно попробовать NaturalReaders.com. Хоть голоса и отдают роботизмом, но звучат вполне неплохо)
Впрочем, самые хорошие голоса по звучанию предоставляются только за платный аккаунт). Сама пробовала лишь английский текст озвучивать таким образом, но там еще и французский, немецкий, итальянский, испанский и даже арабский есть) только как звучат они - я без понятья.

Date: 2014-05-27 12:53 pm (UTC)
From: [identity profile] gkild.livejournal.com
Андройд спокойно понимает русскую речь. Можно даже диктовать не словами, а небольшими предложениями. Записывает в файл. Для винды и мака програм не нашёл (если не считать недоделанный Горыныч).
За англицкую не уверен, но мак её вроде тоже щёлкает.

Date: 2014-05-27 12:59 pm (UTC)
From: [identity profile] g-kar.livejournal.com
К "Хрому" вроде как уже прикрутили апп для этого:
https://chrome.google.com/webstore/detail/voice-recognition/ikjmfindklfaonkodbnidahohdfbdhkn

(no subject)

From: [identity profile] gkild.livejournal.com - Date: 2014-05-27 01:03 pm (UTC) - Expand

Date: 2014-05-27 12:56 pm (UTC)
From: [identity profile] cuiet.livejournal.com
Мне ребенок письма голосом набирает на самом дешевом андроидном аппаратике. В 80% случаев - вполне нормально все.

Date: 2014-05-27 12:56 pm (UTC)
From: [identity profile] ommahalakshmi.livejournal.com
Как бывший работник компании Олимпус, производящей в том числе и крутецкие диктофоны, скажу ответственно - такая программа есть.
Устанавливается на диктофоны приблизительной стоимостью от 800 евро и выше.

Большая сложность этой программы настройка на язык, и именно поэтому, например тот же Олимпус не имеет русифицированной версии.
Если не ошибаюсь, английский, немецкий там был.
В интернете не встречала, из кулуаров производства знаю, что в этой проге полно подводных камней, и именно поэтому она не тиражируется в народ.

Date: 2014-05-27 12:57 pm (UTC)
From: [identity profile] g-kar.livejournal.com
У Гугла распознавание на Android относительно сносное.
Но, увы, без пунктуации, и иногда слова всё-таки путает.

Ответ в чате со смартфона написать сойдёт, а для серьёзной работы вряд ли :(

Date: 2014-05-27 12:58 pm (UTC)
From: [identity profile] febb.livejournal.com
Я работал в такой компании:

http://www.nuance.com/dragon/dads-and-grads/index.htm

:)

Date: 2014-05-27 01:04 pm (UTC)
From: [identity profile] onezima.livejournal.com
Увы. Слежу за этой темой из профессионального интереса. Хотя сегодня уже немного лучше, чем 10 лет назад. Основная проблема - именно в распознавании речи. Все, что на открытом рынке есть, способно распознавать более или менее качественно речь, произнесенную с хорошей артикуляцией (как у диктора), в спокойном темпе. О том, чтобы такими средствами расшифровывать, например, аудиозапись доклада на мероприятии или какой-нибудь профессиональной дискуссии - пока только мечтаем. Хорошо работают программы на распознавание коротких заметок, коротких правильных фраз и т.п. - такого уровня задачи решают уже всякие встроенные приложения в смартфонах и планшетах. Но мы продолжаем мечтать о большем :).
Промышленные разработки - закрытые, полузакрытые и очень дорогие.
Хотя я думаю, что многие журналисты бы заплатили немало за то, чтобы такую прогу наконец получить для работы.
Edited Date: 2014-05-27 01:05 pm (UTC)

Date: 2014-05-27 03:24 pm (UTC)
From: [identity profile] nof-nof.livejournal.com
плюс много

Date: 2014-05-27 01:04 pm (UTC)
From: [identity profile] curlyzu.livejournal.com
в обе стороны уже умеют. Приятель в питере разработкой занимается

Date: 2014-05-27 01:06 pm (UTC)
From: [identity profile] onezima.livejournal.com
А Вы не могли бы поделиться названием решения? очень хочется протестировать, т.к. все же от стадии разработки до стадии готового продукта может быть очень большая дистанция.

(no subject)

From: [identity profile] curlyzu.livejournal.com - Date: 2014-05-27 01:13 pm (UTC) - Expand

Date: 2014-05-27 01:15 pm (UTC)
From: [identity profile] kam-4atka.livejournal.com
если такая программа будет, я лишусь работы :))))

Date: 2014-05-27 04:37 pm (UTC)
From: [identity profile] wasilisa.livejournal.com
приветствую, коллега!
ну и пускай все эти комментаторы заблуждаются, зато потом они всё равно принесут нам свои денежки, потому что их хвалёные программы не умеют так, как мы :)

(no subject)

From: [identity profile] kam-4atka.livejournal.com - Date: 2014-05-27 05:25 pm (UTC) - Expand

Date: 2014-05-27 01:20 pm (UTC)
From: [identity profile] tljustenkhabl.livejournal.com
Гуглить:
Siri, Cortona, Dragon
для основных европейских, арабского, японского, китайского - работает.
И вроде даже для русского.
Но как работает - сказать предложение из 3-4 слов, подберет наиболее употребимые э... назовем их ресембл-фонами. Сири например какие-то слова не разберет совсем, хоть как не произноси.
Драгон - эта прямо программа для того, чтобы тексты можно набирать голлосом. Но ручному вводу с клавиатуры по скорости проигрывает, потому что много ошибок, которые нужно редактировать.
Page 1 of 3 << [1] [2] [3] >>

Profile

miumau: (Default)
Копия блога Яны Франк

October 2017

S M T W T F S
1234567
891011121314
15161718192021
22232425262728
293031    

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 28th, 2026 10:39 am
Powered by Dreamwidth Studios