Распознавание речи

Обсуждение программ и аппаратных средств

Модераторы: Oden, Сочин, maniac, Boo

Распознавание речи

Сообщение Andrew 27 Март Понедельник, 2006 21:42

Напсанно по просьбе моего друга.
Если кто то откликнется, прошу выложить файлы на ftp и тут написать ссылки на файлы. Я найду возможность передать их автору. Или, если вам удобнее, можете выслать по указанному ниже адресу. Автор проекта обещал предоставить результаты своего труда каждому желающему )

PS

Здравствуйте!

Вы приглашаетесь для участия в эксперименте по созданию речевой базы русских слов, необходимой для разработки программы восприятия русской речи. Если Вы согласны принять участие, то вышлите по адресу электронной почты Bond005@yandex.ru три звуковых файла в формате *.WAV (PCM, 11025 Гц, 8 бит, моно), содержащие звукозаписи слов, сделанные Вашим голосом, и текстовый файл в формате *.TXT, содержащий краткую информацию о себе (ФИО, возраст, пол). Названия этих файлов должны совпадать с Вашими фамилиями (например, файлы Иванова должны носить названия "иванов1.wav", "иванов2.wav", "иванов3.wav" и "иванов.txt").

Каждый из трёх звуковых файлов должен содержать звукозаписи следующих слов и словосочетаний:

1) верхний индекс;
2) вставить;
3) вырезать;
4) две колонки;
5) двойной интервал;
6) добавить таблицу;
7) жирный шрифт;
8) закрыть колонтитулы;
9) колонтитулы;
10) копировать;
11) курсив;
12) мои параметры страницы;
13) мой формат документа;
14) моя таблица;
15) найти;
16) найти далее;
17) нижний индекс;
18) новая страница;
19) новая строка;
20) обычный вид;
21) одинарный интервал;
22) одна колонка;
23) открыть;
24) отменить;
25) параметры автозамены;
26) подчеркнуть;
27) полуторный интервал;
28) показать сетку;
29) по левому краю;
30) по правому краю;
31) по центру;
32) по ширине;
33) правописание;
34) разметка страницы;
35) символ;
36) скрыть сетку;
37) создать;
38) сортировка;
39) сохранить;
40) структура;
41) три колонки;
42) удалить весь столбец;
43) удалить всю строку;
44) удалить со сдвигом вверх;
45) удалить со сдвигом влево;
46) удалить столбец;
47) удалить строку;
48) удалить таблицу;
49) четыре колонки;
50) шрифт;
51) один;
52) два;
53) три;
54) четыре;
55) пять
56) шесть;
57) семь;
58) восемь;
59) девять;
60) десять.

Обращаемся к Вам с убедительной просьбой делать между разными словами/словосочетаниями чёткие паузы (например: "... моятаблица <пауза порядка одной секунды> найти ...").

Сначала Вы произносите 60 слов по вышеописанным правилам и сохраняете их в первом WAV-файле (PCM, 11025 Гц, 8 бит, моно), затем повторяете звукозапись и сохраняете её во втором WAV-файле в таком же формате (PCM, 11025 Гц, 8 бит, моно), а затем в третий раз произносите 60 слов и сохраняете их в третьем WAV-файле.

Звукозаписи можно делать с помощью стандартной Windows-программы "Звукозапись" (Пуск-->Программы-->Стандартные-->Развлечения-->Звукозапись).

С уважением
Бондаренко И.Ю.
e-mail: bond005@yandex.ru
Аватара пользователя
Andrew

 
Сообщения: 766
Зарегистрирован: 08 Сентябрь Четверг, 2005 21:09

Сообщение Andrew 27 Март Понедельник, 2006 21:58

В идеале - надиктовка текста голосом. Пока - речевое управление текстовым процессором microsoft Word.
Аватара пользователя
Andrew

 
Сообщения: 766
Зарегистрирован: 08 Сентябрь Четверг, 2005 21:09

Сообщение nsd 28 Март Вторник, 2006 14:26

а можно полюбопытствовать как это все реализуется и при помощи чего и где планируется применение сего продукта?
Аватара пользователя
nsd

 
Сообщения: 87
Зарегистрирован: 07 Апрель Четверг, 2005 14:53
Откуда: Tokyo-3

Сообщение Andrew 30 Март Четверг, 2006 22:36

Реализуется программной моделью нейросети. Подробностей не знаю. Вернее мне пытались объяснить, но в 8-ми этажных математических формулах и жутких алгоритмах реализации и обучения нейросети я быстро потерял нить разговора ).
Аватара пользователя
Andrew

 
Сообщения: 766
Зарегистрирован: 08 Сентябрь Четверг, 2005 21:09

Сообщение Boo 30 Март Четверг, 2006 22:39

Есть разработки, но пока что на уровне опытных. Реальнее всех владеет ситуацией наш родной Донецкий институт штучного интеллекта.
AMD & Ferrari - Fasters FOREVER !!!
Аффтар, съешь еще этих мягких французских булочек да выпей царской водки!
В лифте на пол не флудить!
Аватара пользователя
Boo
- Just boo it! -
 
Сообщения: 7499
Зарегистрирован: 14 Апрель Четверг, 2005 09:35
Откуда: из Империи Зла

Сообщение Vadim 31 Март Пятница, 2006 09:25

Boo
Есть разработки, но пока что на уровне опытных.

Есть такая система Dragon NaturallySpeaking, причем уже есть версия 8, которая абсолютно реально работает как минимум с двумя языками - английским и испанским. Когда я жил в штатах мой шеф постоянно использовал эту систему для надиктовки текста и управления программами и компьютеорм в целом. Она требует большого тренинга, реально работает только с одним голосом, на который ее в процессе тренинга натаскали - но результаты очень впечатляют.
Так что наш родной ИИИ как обычно занимается всякой херней (часто на грани с шаманством - по крайней мере так было во времена союза), выдавая ее за последние достижения IT.
Vadim

 
Сообщения: 505
Зарегистрирован: 16 Март Среда, 2005 20:43

Сообщение nsd 31 Март Пятница, 2006 10:04

система Dragon NaturallySpeaking
http://warez.gtasoft.ru/modules.php?nam ... ws_id=1352
Код: Выделить всё
Download\Скачать:
http://www.megaupload.com/?d=15LIFVGC
http://www.megaupload.com/?d=14SWKEQV
http://www.megaupload.com/?d=372UCPDP
http://www.megaupload.com/?d=36E654KH
http://www.megaupload.com/?d=27M4AC2I

Rar Password: blitzem
может кто скачает? [335.35 MB]
интересно попробовать как она работает :)
Аватара пользователя
nsd

 
Сообщения: 87
Зарегистрирован: 07 Апрель Четверг, 2005 14:53
Откуда: Tokyo-3

Сообщение Кикаха 31 Март Пятница, 2006 10:17

Есть еще российские разработки, например, программа распознавания речи "Горыныч" 8.0. Эта система позволяет работать с русским языком, имеет объемный встроенный словарь с возможностью наращивания и позволяет надиктовывать текст с микрофона в МС Ворд.
Никто не пробовал, кстати?
Аватара пользователя
Кикаха

 
Сообщения: 2400
Зарегистрирован: 27 Ноябрь Воскресенье, 2005 22:01
Откуда: Хровака, медвежий народ

Сообщение Vadim 31 Март Пятница, 2006 10:34

nsd
Смысла нет - он не поддерживает русский язык.

Кикаха
Судя по названию и версии - это тот же самый дракон - только прошедший некую локализацию :D
Vadim

 
Сообщения: 505
Зарегистрирован: 16 Март Среда, 2005 20:43

Сообщение Andrew 02 Апрель Воскресенье, 2006 11:45

Ну что никто не надумал помочь парню в его исследованиях? Неужели ни у кого микрофона нет?
Аватара пользователя
Andrew

 
Сообщения: 766
Зарегистрирован: 08 Сентябрь Четверг, 2005 21:09

Сообщение mmx 02 Апрель Воскресенье, 2006 12:10

Andrew писал(а):Ну что никто не надумал помочь парню в его исследованиях? Неужели ни у кого микрофона нет?
некоторые ваще тока нашли этот пост. как проснусь, наговорю ;)
Time Will Tell You Who Is Who © Scooter - The Chaser
Аватара пользователя
mmx
Макс
 
Сообщения: 5305
Зарегистрирован: 01 Февраль Вторник, 2005 21:27
Откуда: Автомагазин.dn.ua

Сообщение zmej 04 Апрель Вторник, 2006 16:31

...очень интересная задумка...
микро у меня есть...и если б попросил не Эндрю, то надиктовал бы...
з.ы. у меня на мобиле стоит распознавание английского.
Аватара пользователя
zmej
БледНОлицый ниГГа'дяЙ
 
Сообщения: 542
Зарегистрирован: 15 Июнь Среда, 2005 19:35
Откуда: Калининский район

Сообщение 7,62Ser-J 04 Апрель Вторник, 2006 16:34

zmej писал(а):и если б попросил не Эндрю

а чем это тебе Андрюшка ни нравицо? :spy:
ты давай, не крыси, раз попросили, и у тебя есть такая возможность!
7,62Ser-J
P.I.M.P.
 
Сообщения: 2754
Зарегистрирован: 20 Май Пятница, 2005 14:54

Сообщение zmej 05 Апрель Среда, 2006 16:59

хорошо...только у меня пару вопросов:
шумы вырезать или сами справитесь?
зачем 3 одинаковых файла с разным названием?
Аватара пользователя
zmej
БледНОлицый ниГГа'дяЙ
 
Сообщения: 542
Зарегистрирован: 15 Июнь Среда, 2005 19:35
Откуда: Калининский район

Сообщение Andrew 06 Апрель Четверг, 2006 22:18

Шумы вырезать не надо.
Имеется в виду, что надиктовка будет проводиться 3 раза, каждый раз в другой файл.
Аватара пользователя
Andrew

 
Сообщения: 766
Зарегистрирован: 08 Сентябрь Четверг, 2005 21:09

Сообщение zmej 25 Апрель Вторник, 2006 17:12

Andrew
ftp://192.168.200.4/users/zmej/ там файл exp.rar, пароль 12345
Аватара пользователя
zmej
БледНОлицый ниГГа'дяЙ
 
Сообщения: 542
Зарегистрирован: 15 Июнь Среда, 2005 19:35
Откуда: Калининский район


Вернуться в Hard&Soft

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4

cron