1

Тема: UTF8 Приблуда - нащо?

Хочу запитати товариство, які переваги несе UTF8 - для програмістів? Бо мене цей "костиль"- чомусь не дуже радує.
(Перепрошую якщо не в той розділ вліз)

2

Re: UTF8 Приблуда - нащо?

То не в UTF-8 проблема, а у вас.
https://cdn.discordapp.com/attachments/333936584481177600/404951557403181056/unknown.png

Подякували: vsprosto1

3

Re: UTF8 Приблуда - нащо?

Сумісність з ASCII, себто не ASCII символи розглядаються програмами як кодова сторінка, тому легко працювати з таким юнікодом як зі звичайними однобайтовими стрічками.

Подякували: Eff1c, Yola, 221VOLT, ostap34PHP, leofun01, vsprosto, HetmanNet7

4

Re: UTF8 Приблуда - нащо?

FakiNyan написав:

То не в UTF-8 проблема, а у вас.
https://cdn.discordapp.com/attachments/333936584481177600/404951557403181056/unknown.png

Мені здається - ця картинка застаріла.

5 Востаннє редагувалося vsprosto (22.01.2018 13:43:32)

Re: UTF8 Приблуда - нащо?

FakiNyan написав:

То не в UTF-8 проблема, а у вас.
https://cdn.discordapp.com/attachments/333936584481177600/404951557403181056/unknown.png

Я не сказав що у мене проблема, я питав про інше.
Тобто ви хочете сказати, що перевага в популярності?
Ой не помітив, це ви про використання в Веб - я не це запитував.  :[

Подякували: FakiNyan1

6

Re: UTF8 Приблуда - нащо?

0xDADA11C7 написав:

Сумісність з ASCII, себто не ASCII символи розглядаються програмами як кодова сторінка, тому легко працювати з таким юнікодом як зі звичайними однобайтовими стрічками.

Так в тому то діло коли програма англомовна та написана для англомовців то все чудово, але якщо великі об'єми даних кирилицею?

Подякували: Eff1c1

7

Re: UTF8 Приблуда - нащо?

Кириличні тексти жадна кодова сторінка нормально не відображає (дореформенну російську ять наприклад, хоча та ять це засіб  запозичення з нашої мови і тексти українською з ятями існують), воно все лайно, а будова юнікода протирічить власним принципам - кажній графемі по коду, тож "***** жаба гадюку".

Подякували: vsprosto1

8

Re: UTF8 Приблуда - нащо?

0xDADA11C7 написав:

Кириличні тексти жадна кодова сторінка нормально не відображає (дореформенну російську ять наприклад, хоча та ять це засіб  запозичення з нашої мови і тексти українською з ятями існують), воно все лайно, а будова юнікода протирічить власним принципам - кажній графемі по коду, тож "***** жаба гадюку".

Це так є можливість відобразити навіть глаголичні тексти тисячолітньої давнини в UTF8, при умові якщо шрифт підтримає, а якщо не підтримає то приплили, перевага UTF8 зразу пропадає.

9

Re: UTF8 Приблуда - нащо?

vsprosto написав:

Хочу запитати товариство, які переваги несе UTF8 - для програмістів?

Переваги порівняно із чим? З ASCII? Тоді усе дуже просто: не треба вгадувати кодову сторінку тексту, бо вона для усіх одна. І у той же час на усілякі технічні тексти типу логів (чи розмітки) витрачається усього по одному байту на літеру.

Подякували: 221VOLT, vsprosto2

10

Re: UTF8 Приблуда - нащо?

https://w3techs.com/technologies/overvi … coding/all
UTF-8    90.6%
ISO-8859-1    4.3%
Windows-1251    1.5%

Подякували: 221VOLT, leofun01, vsprosto, HetmanNet4

11 Востаннє редагувалося vsprosto (22.01.2018 17:14:19)

Re: UTF8 Приблуда - нащо?

koala написав:

https://w3techs.com/technologies/overvi … coding/all
UTF-8    90.6%
ISO-8859-1    4.3%
Windows-1251    1.5%

Гм-м яке відношення до програмування має текст збережений в  MS Word, чи цей текст зконвертований в HTML, чи наприклад набраний в TinyMCE.  ;)

12

Re: UTF8 Приблуда - нащо?

чи то людина не доганяє нічого, чи то надто товстий жирний тролінг ...

Подякували: HetmanNet1

13

Re: UTF8 Приблуда - нащо?

Хочу запитати товариство, які переваги несе UTF8 - для програмістів?

Чітко вкажіть де застосування UTF8 вам не подобається, в коментарях програм чи в HTML документації, чи, перепрошую, в сральні. Чим і де ви послуговувалися до того, а тепер вас змушують(чи пропонують?) послуговуватися UTF8? Якщо ви писали мовою С, а тепер вам доводиться писати Рапірою чи 1С, то вас зрозуміти можна, але питання все одно не в ЮТФ8.

РАПІРА

https://replace.org.ua/extensions/om_images/img/5a6614182480d/RAPIRA_example.png

Подякували: 221VOLT, leofun01, /KIT\3

14

Re: UTF8 Приблуда - нащо?

vsprosto написав:
koala написав:

https://w3techs.com/technologies/overvi … coding/all
UTF-8    90.6%
ISO-8859-1    4.3%
Windows-1251    1.5%

Гм-м яке відношення до програмування має текст збережений в  MS Word, чи цей текст зконвертований в HTML, чи наприклад набраний в TinyMCE.  ;)

Ну, якщо ви можете без програм конвертувати текст в MS Word чи HTML, то будь ласка, ніхто ж не проти.
А я користуюся програмами для цього. І пишу такі програми :)

Подякували: Eff1c, 221VOLT2

15

Re: UTF8 Приблуда - нащо?

koala написав:
vsprosto написав:
koala написав:

https://w3techs.com/technologies/overvi … coding/all
UTF-8    90.6%
ISO-8859-1    4.3%
Windows-1251    1.5%

Гм-м яке відношення до програмування має текст збережений в  MS Word, чи цей текст зконвертований в HTML, чи наприклад набраний в TinyMCE.  ;)

Ну, якщо ви можете без програм конвертувати текст в MS Word чи HTML, то будь ласка, ніхто ж не проти.
А я користуюся програмами для цього. І пишу такі програми :)

а чим ви ще займаєтесь в секретаріаті?

16

Re: UTF8 Приблуда - нащо?

vsprosto написав:
koala написав:

https://w3techs.com/technologies/overvi … coding/all
UTF-8    90.6%
ISO-8859-1    4.3%
Windows-1251    1.5%

Гм-м яке відношення до програмування має текст збережений в  MS Word, чи цей текст зконвертований в HTML, чи наприклад набраний в TinyMCE.  ;)

Я не хотів би вас засмутити - але все ж таки пряме. "Документ MS Word" або інше - не міфічні артефакти, це продут роботи програм. SURPRISE! :)

Подякували: 221VOLT, koala2

17 Востаннє редагувалося Дмитро-Чебурашка (23.01.2018 00:18:08)

Re: UTF8 Приблуда - нащо?

Все що в світі не є має своі недоліки і привади. В усьому є щось гарне і погане.

УТФ8 нормально чітається всіма нормальними браузерами та текстовими редагувачами.

Подякували: vsprosto1

18

Re: UTF8 Приблуда - нащо?

Ну добре спробую трохи "підсумувати" та трохи розшифрувати.

які переваги несе UTF8 - для програмістів?

програмісти це люди які мають "Інструмент" із допомогою "інструменту" пишуть програми - чим зручний цей "інструмент" в процесі використання в парі з utf8- які переваги отримуємо?
Інструмент не є продукт -(utf8 не є молоко. якщо програма, що написана з використанням utf8 - інструмент -керує доїльним комплексом і ми отримуємо як результат - продукт - молоко)

Бо мене цей "костиль"- чомусь не дуже радує
Тобто при використанні "інструменту" + utf8 задоволення не принесло.

Більшість з вас бачать в основному переваги UTF8.
А по перше модно популярно.
для програміста - всі вимагають підтримки, всі програми обов'язково з utf8. 
По друге універсально- текст написаний в utf8 кругом однаковий та не вимагає перекодування, особливо цінно в Веб (але за умови наявності символів вашої національності в шрифті відображення інакше побачимо пустий квадратик)
для програміста -  не треба шукати таблиці перекодування для локалізації достатньо просто текст перекласти.
По третє utf8 стає стандартом.
для програміста, відходять ті часи коли в редакторі замість символів національного алфавіту ми бачимо крякозябри.

Недоліки
по перше великий розмір даних- для  не латинських символів -для кирилиці в два рази.(Зауважу для веб сторінок це менше- багато займають службові слова)
по друге складність оперування посимвольно для не латинських символів - не можна звернутись як до масиву байт, програмно оперувати з utf8 стрічкою складніше.
по третє на великих обємах падає продуктивність.

З реальних давніх  випадків - була база 17 тис абонентів - доступ був через базу sql firebird писана була спочатку на delfi 7 потім на codetyphon без підтримки потім з підтримкою utf8 - швидкість виборки з utf8 - в два рази повільніше.

ну от ще приклад коду визначення довжини стрічки
UTF8Length (дивитись знизу догори)

function UTF8CodepointSizeFull(p: PChar): integer;
begin
  case p^ of
  #0..#191: // %11000000
    // regular single byte character (#0 is a character, this is Pascal ;)
    Result:=1;
  #192..#223: // p^ and %11100000 = %11000000
    begin
      // could be 2 byte character
      if (ord(p[1]) and %11000000) = %10000000 then
        Result:=2
      else
        Result:=1;
    end;
  #224..#239: // p^ and %11110000 = %11100000
    begin
      // could be 3 byte character
      if ((ord(p[1]) and %11000000) = %10000000)
      and ((ord(p[2]) and %11000000) = %10000000) then
        Result:=3
      else
        Result:=1;
    end;
  #240..#247: // p^ and %11111000 = %11110000
    begin
      // could be 4 byte character
      if ((ord(p[1]) and %11000000) = %10000000)
      and ((ord(p[2]) and %11000000) = %10000000)
      and ((ord(p[3]) and %11000000) = %10000000) then
        Result:=4
      else
        Result:=1;
    end;
  else
    Result:=1;
  end;
end;
 \\------------------------------------------------
function UTF8CodepointSize(p: PChar): integer; inline;
begin
  if p=nil then exit(0);
  if p^<#192 then exit(1);
  Result:=UTF8CodepointSizeFull(p);
end;
\\---------------------------------------------
function UTF8Length(p: PChar; ByteCount: PtrInt): PtrInt;
var
  CharLen: LongInt;
begin
  Result:=0;
  while (ByteCount>0) do begin
    inc(Result);
    CharLen:=UTF8CodepointSize(p);
    inc(p,CharLen);
    dec(ByteCount,CharLen);
  end;
end;
\\---------------------------------------
function UTF8Length(const s: string): PtrInt;
begin
  Result:=UTF8Length(PChar(s),length(s));
end;       

І ще одне якщо ваші тексти латиницею та ваш utf8 і самий простий мікроконтролер "з'їсть" ,бо робота буде виглядати як з  ASCII.

Подякували: 0xDADA11C7, Eff1c, HetmanNet3

19 Востаннє редагувалося 221VOLT (24.01.2018 00:58:33)

Re: UTF8 Приблуда - нащо?

та досить уже utf8 називати костилем !!
майте совість

таке враження що ви все життя прожили в Лондоні і нічого крім latin1 не знаєте і не хочете знати,
вам не потрібна кирилиця і купа всього ще, чи що?

чи можливо ви чомусь думаєте що потрібно поскиглити декілька днів на форум на тему того що utf8 вас обіжає,
і utf8 у вас попросить вибачення, тепло обійме, чаю вам зробить?
чому ви так думаєте?

Подякували: leofun01, Betterthanyou, bunyk, HetmanNet4

20

Re: UTF8 Приблуда - нащо?

vsprosto
Якою кодовою сторінкою ви послуговувалися до того?

З реальних давніх  випадків - була база 17 тис абонентів - доступ був через базу sql firebird писана була спочатку на delfi 7 потім на codetyphon без підтримки потім з підтримкою utf8 - швидкість виборки з utf8 - в два рази повільніше.

Ну то ведіть БД кодовою сторінкою, але імпортуйте дані з УТФ8. Я вважаю, що всі кодові сторінки гидотні і юнікод гидотний, нема людської кодової сторінки для ціє ї ж кирилиці(не лише чинний правопис) з псевдографікою і грецькою абеткою.

Подякували: leofun011