41

Re: Транслітерація букв українського алфавіту латиницею для CMS

По логіці речеь, так. Але мені до вподоби сортувати з типом звуків, приклад вже кидав вишче.

Букву Ф, ӓк там тутешні деӓкі не писали через ХВ, заьвоӱ поки важко назвати, бо згадані мноӱ легко розбиваӱтьсӓ на инші, а цӓ ні. Але зменшити суцільно її цілком можна, особливо через клӓсичного правопису з грецького запозиченнӓ. На W ліпше накинути точно таке звучаннӓ В у більшости випадках, або точніше, то точно така білоруська Ў.

42

Re: Транслітерація букв українського алфавіту латиницею для CMS

Але ота w є тільки в галицькому правописі, а потім пропала.

43

Re: Транслітерація букв українського алфавіту латиницею для CMS

Певно таки треба брати білоруську латинку, однією зміною що л тверде. А потім йти шляхом есперанто і при потребі заміняти діакритичні знаки на диграфи з x. Єдине питання наскільки болісно буде зміна ч->с, ц->cx. А не навпаки як зараз.

44 Востаннє редагувалося dot (21.02.2018 00:28:21)

Re: Транслітерація букв українського алфавіту латиницею для CMS

Буква W пропала, а звук — зовсім ні.

Білоруська латинка це копіӱваннӓ сумішу з польської, зі своїми проблемами, та чешської, тому це не наькрашчиь шлӓх. Часткове рішеннӓ вже кидав [раніше].

Про абетку есператно треʼ дослідіти, але на око кидаётьсӓ проблема з групоӱ Х Ґ Г Ж. А инші речі теж не сильно відріжнӓӱтьсӓ від чеської.

45

Re: Транслітерація букв українського алфавіту латиницею для CMS

Я про есперанто в тому сенсі, що там де є діакритичні знаки і їх немає в розкладці, то використовують дисграф з буквою x

46 Востаннє редагувалося dot (21.02.2018 13:16:13)

Re: Транслітерація букв українського алфавіту латиницею для CMS

Шчось подібне згадував [шче тут (де думки утікаӱть)]

б) повна форма написаннӓ, коли все-таки існуӱть допоміжні знаки, але, раптово, немаё змоги написати їх, штибу німецкі Ä АЕ, Ö OE, Ü UE.

Але тут це не спрацӱё, бо а) пан використовуё всӱ абетку; б) не через звуковиь підхід; чи не так? Звісно, можна теж так зробити, цебто викинути, наприклад Q, але тоді буде шчось на зразок Щ SQCQ. Можна замінити Ч на Ц, але все одно Ц за частотоӱ подібна.

47

Re: Транслітерація букв українського алфавіту латиницею для CMS

Треба буде створити частотний аналізатор і перегнати через нього кілька книг. Але в тому числі включити всі буквосполучення.

48

Re: Транслітерація букв українського алфавіту латиницею для CMS

Я страдав страдав. Вле все ж виходить що абетка есперанто є достатня для української мови. І якщо брати використання діактричних знаків, то я би використовував z - систем.

49

Re: Транслітерація букв українського алфавіту латиницею для CMS

Доречі а чого ця тема в розділі системи керування контентом, я її ледве знайшов.

50

Re: Транслітерація букв українського алфавіту латиницею для CMS

Vo_Vik написав:

Певно таки треба брати білоруську латинку, однією зміною що л тверде. А потім йти шляхом есперанто і при потребі заміняти діакритичні знаки на диграфи з x. Єдине питання наскільки болісно буде зміна ч->с, ц->cx. А не навпаки як зараз.

У білорусів, як і в поляків, нема м'яких ть, дь (які перейшли в ць, дзь) — відповідно, нема й потрібних букв латиниці (тому доведеться взяти чеські). В чехів та словаків нема зь, сь, ць — тобто, взагалі нема літер, для яких існувала б одночасно м'яка та шипляча пара — власне, шиплячість одних літер та м'якість інших у них позначаються ідентично. Українська — єдина слов'янська мова, в якій є одночасно ть та ць, тому будь-який варіант на основі інших слов'янських латиниць являє собою поєднання літер кількох алфавітів з різним способом позначення м'якості. Ну або діакритик над Ť, Ď, Ľ хибно тлумачиться як апостроф чи акут (і починає жити своїм життям — заміcть відсутніх у юнікоді D,T з акутом, після них просто дописують апостроф), в ролі м'якої Ľ використовують подовжену Ĺ і т.п.

py -3 -m pip install git+https://github.com/snoack/python-goto
∩⍴○⌈⍴⍺/∧\∨/⊢○ ⌿⍀⍴⌊

51 Востаннє редагувалося P.Y. (28.02.2018 20:42:17)

Re: Транслітерація букв українського алфавіту латиницею для CMS

Vo_Vik написав:

Доречі а чого ця тема в розділі системи керування контентом, я її ледве знайшов.

Бо початково стосувалася автоматичного трансліту для URL, що є поширеною практикою в багатьох CMS. Узагалі, трансліт у цій ролі накладає певні обмеження (наприклад, небажано використовувати розширену латиницю, апострофи та інші спецсимволи, бо на їх місці можуть вилізти шістнадцяткові коди), тому пристосувати на цю роль їречківку чи іншу подібну систему — не варіант.

py -3 -m pip install git+https://github.com/snoack/python-goto
∩⍴○⌈⍴⍺/∧\∨/⊢○ ⌿⍀⍴⌊

52

Re: Транслітерація букв українського алфавіту латиницею для CMS

P.Y. написав:
Vo_Vik написав:

Певно таки треба брати білоруську латинку, однією зміною що л тверде. А потім йти шляхом есперанто і при потребі заміняти діакритичні знаки на диграфи з x. Єдине питання наскільки болісно буде зміна ч->с, ц->cx. А не навпаки як зараз.

У білорусів, як і в поляків, нема м'яких ть, дь (які перейшли в ць, дзь) — відповідно, нема й потрібних букв латиниці (тому доведеться взяти чеські). В чехів та словаків нема зь, сь, ць — тобто, взагалі нема літер, для яких існувала б одночасно м'яка та шипляча пара — власне, шиплячість одних літер та м'якість інших у них позначаються ідентично. Українська — єдина слов'янська мова, в якій є одночасно ть та ць, тому будь-який варіант на основі інших слов'янських латиниць являє собою поєднання літер кількох алфавітів з різним способом позначення м'якості. Ну або діакритик над Ť, Ď, Ľ хибно тлумачиться як апостроф чи акут (і починає жити своїм життям — заміcть відсутніх у юнікоді D,T з акутом, після них просто дописують апостроф), в ролі м'якої Ľ використовують подовжену Ĺ і т.п.

Тереба певно використовувати якусь систему контролю версій для моїх метаній. Бо ви критикуєте ті речі від яких я давно відмовився)

53 Востаннє редагувалося Vo_Vik (11.04.2018 21:29:48)

Re: Транслітерація букв українського алфавіту латиницею для CMS

Vo_Vik написав:

Після багатьох страждань, мій поточний варіант.
A a     B b     C c     D d     Dz dz Djz djz
А а     Б б     Ч ч     Д д     Дз дз Дж дж
E e     Je je     F f     G g     H h     I i     J j     Jz jz     K k     L l
Е е     Є є     Ф ф     Ґ ґ     Г г     І і     Й й     Ж ж     К к     Л л
M m     N n     O o     P p     R r     S s Sz sz
М м     Н н     О о     П п     Р р     С с     Ш ш
Sc sc     T t     Tz tz     U u     Ju ju     V v     W w     X x     Y y     Z z
Щ щ     T t     Ц ц     У у     Ю ю     В в     Вв вв(ув) Х х    И и     З з

j - після приголосних помякшує. За виключенням якщо після нього йде z (nj, lj, tj - нь, ль, ть)
Голосна йотує голосну що йде після неї. Maria, Buae (Буяє), Uava (Уява)
Якщо треба розділити букво сполучення використовуємо апостроф piv'jabluka, ne'oplan, Pid'zamce, Pid'jzabje
У випадку подвоєння буквосполучення, подвоюється тільки z - pidnijzzja, zbijzzja, Nitzza

У випадку здвигу до харківського правопису ль -> l, л -> l'

Відповідно
Sce ne vmerla Ukrainy ni slava, ni volja.
Sce nam, brattja ukrainci, usmixnetjsja dolja.
Zhynutj naszi vorijzenjky, jak rosa na sontzi,
Zapanuem i my, brattja, u svoij storontzi.

Duszu j tilo my polojzym za naszu svobodu,
I pokajzem, sco my, brattja, kozatzjkoho rodu.

За два місяці метань. Трохи поміняв свої погляди. От що бачу як оптимальне на даний час.

A a     B b     C c     D d     Dz dz   E e     Je je     F f
А а     Б б     Ч ч     Д д     Дз дз   Е е     Є є     Ф ф
G g     Gz gz   H h     I i     J j     Jz jz     K k     L l
Ґ ґ     Дж дж   Г г     І і     Й й     Ж ж     К к     Л л
M m     N n     O o     P p     Q q     R r     S s    X x
М м     Н н     О о     П п   Х х     Р р     С с     Ш ш
Xc xc   T t     Tz tz     U u     Ju ju     V v     W w     Y y     Z z
Щ щ     T t     Ц ц     У у     Ю ю     В в     Вв вв(ув)    И и     З з

j - після приголосних помякшує. За виключенням якщо після нього йде z (nj, lj, tj - нь, ль, ть)
Голосна йотує голосну що йде після неї(крім о яку треба постійно йотувати). Maria, Buae (Буяє), Uava (Уява)
Якщо треба розділити букво сполучення використовуємо апостроф piv'jabluka, neoplan, Pid'zamce, Pid'jzabje
У випадку подвоєння дисграфа, подвоюється тільки z - pidnijzzja, zbijzzja, Nitzza

У випадку здвигу до харківського правопису ль -> l, л -> l'

Відповідно
Xce ne vmerla Ukrainy ni slava, ni volja.
Xce nam, brattja ukraintzi, usmiqnetjsja dolja.
Zhynutj naxi vorijzenjky, jak rosa na sontzi,
Zapanuem i my, brattja, u svoij storontzi.

Duxu j tilo my polojzym za naxu svobodu,
I pokajzem, sco my, brattja, kozatzjkoho rodu.

54

Re: Транслітерація букв українського алфавіту латиницею для CMS

Чому Ц = TZ, a не TS? Проблем не бачу.

Подякували: leofun011

55

Re: Транслітерація букв українського алфавіту латиницею для CMS

Та принципової різниці нема. Просто все ж тримаюсь z як допоміжної букви для дисграфів, щоб по словнику вони краще лежали. Якщо використовувати s, тоді міняються такі дисграфи. Ц -ts, ж - zs, дж - gs, що є теж непоганим варіантом. Просто при сортувані ці звуки будуть йти поміж інших а не окремо.

56

Re: Транслітерація букв українського алфавіту латиницею для CMS

а якщо так?

A a     B b     C c     Cq cq   D d     Dz dz   E e     Je je     F f
А а     Б б     Ш ш     Щ щ     Д д     Дз дз   Е е     Є є     Ф ф
G g     Gz gz   H h     I i     J j     K k     L l
Ґ ґ     Дж дж   Г г     І і     Й й     К к     Л л
M m     N n     O o     P p     Q q     R r     S s    X x
М м     Н н     О о     П п     Ч ч     Р р     С с     Х х
T t     Ts ts     U u     Ju ju     V v     W w      Y y      Z z     Zc Zc
T t     Ц ц     У у     Ю ю     В в     Вв вв(ув)    И и     З з     Ж ж

j - після приголосних помякшує (nj, lj, tj - нь, ль, ть)
Голосна йотує голосну що йде після неї(крім о яку треба постійно йотувати). Maria, Buae (Буяє), Uava (Уява)
Якщо треба розділити букво сполучення використовуємо апостроф piv'jabluka, neoplan, Pid'zamce, Pid'zcabje

Відповідно
Cqe ne vmerla Ukrainy ni slava, ni volja.
Cqe nam, brattja ukraintsi, usmixnetjsja dolja.
Zhynutj naci vorizcenjky, jak rosa na sontsi,
Zapanuem i my, brattja, u svoij storontsi.

Ducu j tilo my polozcym za nacu svobodu,
I pokazcem, cqo my, brattja, kozatsjkoho rodu.

Крім того є ще один момент, можна попробувати писати замість й, 'j -> y
Відповідно: п’є -> pye, б’є -> bye, найкращий -> naykracqyy, чудовий -> qudovyy.

Тобто якщо y йде між двома приголосноми чи в кінці слова після приголосної, то воно и, у всіх інших випадках й. Поки що я не зміг згадати слова де би була неоднозначність у читанні.

Cqe ne vmerla Ukrainy ni slava, ni volja.
Cqe nam, brattja ukraintsi, usmixnetjsja dolja.
Zhynutj naci vorizcenjky, yak rosa na sontsi,
Zapanuem i my, brattja, u svoiy storontsi.

Ducu y tilo my polozcym za nacu svobodu,
I pokazcem, cqo my, brattja, kozatsjkoho rodu.

57 Востаннє редагувалося Vo_Vik (10.07.2018 14:30:35)

Re: Транслітерація букв українського алфавіту латиницею для CMS

А нє знайшов проблемні місця, лиє, виє, гниє.
тоді хіба що так lyye, vyye, hnyye(чи тут через Ґ, gnyye)

58

Re: Транслітерація букв українського алфавіту латиницею для CMS

Або змінити вимову на ліє, віє, гніє)
lie, vie, hnie

59

Re: Транслітерація букв українського алфавіту латиницею для CMS

Ще отакий варіант наразі подобається:

Xce ne vmerla Ukrain'i ni slava, ni volya.
Xce nam, brattya ukraintsi, usmiqnetysya dolya.
Zh'inuty naxi vorijenyk'i, yak rosa na sontsi,
Zapanuem i m'i, brattya, u svoiy storontsi.

Duxu y tilo m'i poloj'im za naxu svobodu,
I pokajem, xco m'i, brattya, kozatsykoho rodu.

60

Re: Транслітерація букв українського алфавіту латиницею для CMS

https://www.google.com/url?sa=t&sou … S4y9Qsi0zx - частотний аналіз використання букв в українській мові.

Подякували: PRY1