2. *Развитие интернет-технологий в Башкирии.
*Рост количества веб-сайтов, социальных сетей, блогов
на башкирском языке.
*Внедрение электронного документооборота.
*Первый в Сети веб-сервис, предназначенный для
транслитерации башкирского текста.
3. – разработка веб-сервиса, автоматически
преобразующего текст из бытовой системы письма
в правильное написание.
Примеры бытовой системы письма:
Бытовая система
письма
Спаренная буква Спецсимвол
Правильное
написание
Рэхмэт Э Ә Рәхмәт
Дустар С Ҫ Дуҫтар
Яз З Ҙ Яҙ
Тышлык К Ҡ
Тышлыҡ
Гумер Г Ғ Ғүмер
5. Название
объекта
Фрагмент HTML-кода Графическое представление
Поле
ввода/вывода
текста
Кнопка
Подключение
JavaScript к
HTML
<textarea name="textarea"
cols="70" rows="20"
id="textarea"
placeholder="Введите текст..."
maxlength="1000">
</textarea>
Введите текст…
<button id="button"
type="button">
<div align="center">Переделать
</div>
</button>
Переделать
Основные элементы.
<script src="data.js"></script>
<script src="brat.js"></script>
<script src="replacer.js"></script>
6. Data.js
– содержит массивы
со статистическими
данными
Brat.js
-
определяет, башкирс
кое это слово или
нет
Replacer.js
– заменяет русские
буквы на башкирские
7. Рассмотрим слово
«шагирэ».
Присутствуют спецсимволы
(Ә,Ӛ,Ү…)?
НЕТ
Присутствуют спаренные
символы (А,Э,Г..)?
ДА
Слово башкирское?
См. следующий кадр…
var bashLetters = /[Ғ^Ҙ^Ҡ^Ң^Ӛ^Ҫ^Ү^Һ^Ә]/;
if (word.match(bashLetters))
{
// Слово башкирское. Замен не требуется.
}
else
{
// В слове отсутствуют спецсимволы.
}
var sharedLetters = /[Г^З^К^Н^О^А^С^У^Х^Э^Е]/;
if (word.match(sharedLetters))
{
// В слове присутствуют спаренные символы.
}
var word = document.getElementById('textarea').value;
9. Статистические данные хранятся в массивах:
var lettersRus = ["П", "С", "В"…
var frequencyRus = [12.61620016, 10.54564068, 9.990117223…
Сравниваем частотности:
if (frequencyRus[x] > frequencyBash[y])
{
// Слово русское.
}
else
{
// Слово башкирское.
}
var x = lettersRus.indexOf(“Ш”);
var y = lettersBash.indexOf(“Ш”);
Находим номер элемента в массиве:
10. Ш
А
Г
И
Р
Э
Возможные
варианты:
шаг шағ шәг шәғ
Частотность: 0.001712507 0.040658522 - 0.000964412
Возможные
варианты:
ирэ ирӛ ирә
Частотность: 9,62338683166541E-06 - 0,078584577
Ш
А
Ғ
И
Р
Ә
Производится на основе статистических данных