О проекте
В рамках языковой политики тюркских стран важно иметь механизм сетевого автоматизированного преобразования между несколькими алфавитами: кириллицей, арабской вязью, латиницей и орхонской графикой.Сравнительно-синтаксический анализ тюркских текстов с применением синхронных и асинхронных методов исторической лингвистики одновременно в нескольких алфавитных системах облегчает задачу по уточнению пересмотра, упрощению правил правописания, орфографии, пониманию единства общетюркского культурно-исторического и лингвистического пространства.
Преобразование должно выполняться с учетом закона сингармонизма, прогрессивной и регрессивной ассимиляции, исторического закона фонетического чередования звуков, общепринятых стандартов прочтения графем в странах с развитыми технологиями, принципами синтаксической транслитологии.
Данный механизм в свою очередь призван упростить неизбежный процесс внедрения и применения техники и технологий. Поэтому следует рассматривать систему преобразования, транслитерации и коррекции текста в тесном контакте с техническим решением и его продвижением в интернет сообществе.
Разработке данной системы призвана содействовать «Синтаксическая транслитология», находящаяся на стыке филологии, исторической лингвистики, палеографии, программирования, инфокоммуникационных наук и математики.
Весомым аргументом в пользу внедрения механизма сетевого автоматизированного преобразования является объективный процесс латинизации в Интернет сообществе. С практической точки зрения данный механизм призван помочь субъектам - участникам массовых информационных коммуникаций (переводчикам, бизнесменам, учителям, библиотекам, студиям, органам власти, СМИ).
Практическое применение предлагаемого преобразования заключается в возможности автоматического представления текста в алфавите, который удобен для читателя текста. При этом семантический смысл текста остается неизменным.
Предусматривается возможности реализации IT сервиса для интеграции преобразования с различными системами: интернет сайтами, государственными информационными порталами, мобильными телефонами
Математическая модель преобразования
Алфавит, текст и функция транслитерации
Алфавит – множество символов A={α}. Мы используем три алфавита: Кириллица A_K Латиница A_L Арабица A_A
Текст T(A)=〈α_1,α_2,⋯,α_n 〉,α_i∈A – это упорядоченное множество символов одного из алфавитов A∈{A_K,A_L,A_A }. Один и тот же текст может быть представленный с использованием различных алфавитов, при чем смысл текста (т.е. его семантика) не изменяется.
Функция транслитерации – преобразование текста из одного алфавита в другой без изменения его семантического смысла f_(l_1,l_2 ):T(A_(l_1 ) )→T(A_(l_2 ) ).
Мы допускаем возможность преобразования текста при котором исходный алфавит A_(l_1 ) и результирующий алфавит A_(l_2 ) тождественны. Для определения функции транслитерации используется словарь D(f_(l_1,l_2 ) ) – упорядоченный набор пар символов или сочетаний таких символов D(f_(l_1,l_2 ) )={(s_1,s_2 )_i│s_1=T(A_(l_1 ) ),s_2=T(A_(l_2 ) ),∀i

