ВСС с първа стъпка към въвеждането на софтуера „voice to text“, ще съобразява и диалектите
Членове на съвета изразиха опасения как ще се справят с трънския говор
Висшият съдебен съвет предприе първата стъпка за въвеждането на софтуер за транскрибиране на глас в текст (voice to text) в съдебната система в България, като ще съобразява и местните диалекти. С трънския трудно ще се справим, вметна Георги Кузманов при обсъждането на предложението, което единодушно беше подкрепено от кадровиците.
Всъщност именно заради спецификите в говора на различни места в страната дебатът мина в шеги и закачки.
Всичко тръгна от Севдалин Мавров, който заяви: „С въвеждането на софтуера за преобразуване на глас в текст, ще трябва да променим и начина на разпит на хората, които са с най-различен диалект, говор, изказ. Ще трябва да преминем към отговори само с „да“ и „не“, защото българският език е сложен“.
Репликата му предизвика оживление в залата.
Георги Кузманов поясни, че в Апелативен съд-Бургас вече тестват такава система. Попитаха го дали е съобразен бургаският диалект, на което той отговори: „И бургаският, и странджанският… С трънския диалект трудно ще се справим“.
Аз се надявам, че колегите съдии не говорят на диалект, каза Даниела Марчева.
„Това, което колегата Мавров каза почти на шега, е вярно. При транскрибиране на глас в текст на съдебен протокол, ще трябва да бъдат съобразени спецификите в говора. Хората имат различна височина на гласа, артикулация, диалекти“, отбеляза Атанаска Дишева.
Иначе тя заяви, че е впечатлена от предложението и е на мнение, че то би било полезно на системата.
Какво всъщност предлагат четирима членове на съвета Даниела Марчева, Драгомир Кояджиков, Пламена Цветанова и Светлана Бошнакова – да се въведе система за запис и конвертиране на аудио-реч в текст, с помощта на която магистратите, вместо да набират актовете си ръчно, да могат да ги диктуват и да получават автоматично набран текст, позволяващ бързо форматиране, търсене, рефериране и много други опции за допълнителна текстообработка и референции към всички ключови сегменти от актовете.
Даниела Марчева посочи, че ако такъв софтуер заработи, времето при изготвянето на един документ ще се съкрати с 60%, а това ще доведе до оптимизиране работата на магистратите и служителите.
Тя заяви, че темата не е нова, до момента IT специалистите са отговаряли, че българският език е проблем при прилагането на такъв софтуерен продукт.
Все пак Марчева и колегите ѝ направили анализ как стоят нещата в други държави и стигнали до извода, че той може да бъде въведен у нас. Тя била впечатлена от опита, който имат в Полша, където за два месеца била изработена и въведена такава система. „Полският език е уникален. Доскоро не знаех, че там пишат с латински букви. Според мен софтуерът по-лесно ще работи с българския език, защото той е по-твърд, докато полският е по-мек“, каза още Марчева.
Тя добави, че ще е необходимо и въвеждането на около 2000 правни термина в системата, както и обучение на хората за работа с нея.
В Полша въвеждането на системата е струвало 2.6 млн. евро, които са били отпуснати от Европейския фонд за регионално развитие.
Марчева отбеляза, че фондът финансира „иновации и научни изследвания и програми за цифрови технологии“. Затова е на мнение, че и ВСС може да бъде обърне към него за отпускане на средства за въвеждането на софтуера за преобразуване на глас в текст.
По предложение на Гергана Мутафова съветът реши още предложението да бъде съгласувано и с Държавната агенция за електронно управление.
14
Коментирайте
АЗ ИЗПОЛЗВАМ ТАКАВА ПРОГРАМА И ВЧЕРА ИЗПИСАХ ПИСМЕНИ РАБОТИ\ИСКОВИ МОЛБИ,ЧАСТНИ ЖАЛБИ И ДР.\ ПО 20 ДЕЛА ЗА ТРИ ЧАСА ВМЕСТО ЗА СЕДЕМ ЧАСА.ЕДИНСТВЕНО ПРОГРАМАТА СЕ ЗАТРУДНЯВА СЪС СЛОЖНИ ДУМИ И ПУНКТОАЦИЯ НЕ ПРАВИ,НО ТОВА РЪЧНО МОЖЕ ДАСЕ ПРАВИ.ТАЗИ ПРОГРАМА СПЕСТЯВА ФИЗИЧЕСКИ УСИЛИЯ И ВРЕМЕ
С извинение, но от правописа ви се вижда как работи този софтуер.
Някой ще усвои едни пари за софтуера, а после ние ще гледаме текста като индианец пишеща машина.
Може би не всички мислят в „схеми“ като Вас.
Индианците използват доста по- сложни азбуки /абугиди / силабарии, които на вас, съвременните „милениали“ и предходните им, особено при съвременното равнище на образованието ще им отнемат години обучение, без надежда за свестен резултат. Мнението ми е оформено върху наблюдения над „правопис“ на несложни думичики като „истории“, „понякога“, „понеже“, „защото“ и тъй нататък …
Та, по-спокойно с „индианските сравнения“.
Вашето име: Ана Синона. Аааааааааа „Ана с едно Н“.
а, това е като онзи полицай от „Туйн Пийкс“, дето всичко си го диктуваше на касетофонче. И заради това до последно не се разбра кой уби Лора Палмър.
Струва ми се, че този софтуер няма как да спести 60% от времето за писане на актове, защото неминуемо ще дава много грешки поне в началото и съдията ще трябва да чете много внимателно конвертирания текст, защото може да се стигне до тежки пороци при автоматизацията.
Излиза, че съдиите говорят на трънски, защото разбирам, че показания няма да се записват по този начин.
Трябва много здраво да поработят върху OCR-ването на диалекта.
Много интересно, но трудно приложимо, защото това е технология в ранен стадий и дава много бъгове. Работи добре само при платформи като Google и то на най-разпространените 3 езика. Българският е бутиков и девелопърите нямат интерес да развиват технологията за толкова малко потребители.
След като са го направили в Полша, защо да не го направят и в България?
Технолигиите са винаги въпрос на пари. Изкуственият интелект отдавна не е в раздела Научна фантастика.
Съвършенството на технологията е въпрос на пари. Гугъл и др.продукти, които се предлагат в момента, са несъвършени именно защото са безплатни и защото пазара е малък. Когато се направи целево и се „тренира“ софтуеъра за съдебната система, няма как да не работи.
Колега, като гледам правописа в коментара Ви, си мисля, че най-добрият изкуствен интелект ще се затрудни, особено в пунктУацията, която използвате. А главните букви са истински венец. u