Глюк при роботі Regex з українською абеткою

1 Тема від Teg Miles 09.09.2023 15:46:28

Teg Miles
Користувач
Поза форумом

Дата реєстрації: 20.01.2016
Повідомлень: 608

: 128

Тема: Глюк при роботі Regex з українською абеткою

Пишу код, який має прибирати всі нелітери зі слова. Це потрібно для сортування за абеткою.
Натрапив на цікаву поведінку Regex при обробці української абетки.
Ось код для тесту(має зникати лише апостроф після літери «В»):

string start_word {"АБВ'ГҐДЕЄЖЗІИЇЙКЛМНОПРСТУФХЦЧШЩЬЮЯабвгґдеєжзіиїйклмнопрстуфхцчшщьюя"};
string result_word;
//regex re {"(\W)"};
//regex re {"[^А-ЩЬЮЯҐЄІЇа-щьюяґєії]"};
regex re {"[^АБВГҐДЕЄЖЗІИЇЙКЛМНОПРСТУФХЦЧШЩЬЮЯабвгґдеєжзіиїйклмнопрстуфхцчшщьюя]"};

string replacement {""};
result_word = regex_replace(start_word, re, replacement);
cout << result_word << endl;

Перша формула Regex("(\W)") взагалі не працює чомусь, як я зрозумів.
Треба лише вказувати діапазон літер (A-Z, наприклад).
Хоча в Пайтон така формула добре працювала для будь-якої абетки.
Друга формула працює лише частково.
Якщо запустити цей код і поглянути на вивід до консолі,
то можна побачити, що після літери «п»(лише маленької) чомусь зникає кілька літер.
Замість них з'являється знак питання в квадратику.
Якщо використати третю формулу, усе працює чудово.

Чому діапазон «а-щ» не працює як слід?
Чи є в Regex для C++ короткий запис усіх літер(нелітер) будь-якої абетки?

2 Відповідь від P.Y. 09.09.2023 16:47:20

P.Y.
Replace Team
Поза форумом

Дата реєстрації: 19.02.2013
Повідомлень: 7 868

Ласкаво просимо!

Повідомлення: 17

1 Тема від Teg Miles 09.09.2023 15:46:28

Тема: Глюк при роботі Regex з українською абеткою

2 Відповідь від P.Y. 09.09.2023 16:47:20

Re: Глюк при роботі Regex з українською абеткою

3 Відповідь від Teg Miles 09.09.2023 17:02:01

Re: Глюк при роботі Regex з українською абеткою

4 Відповідь від wander 09.09.2023 17:30:22 Востаннє редагувалося wander (09.09.2023 17:42:21)

Re: Глюк при роботі Regex з українською абеткою

5 Відповідь від Teg Miles 09.09.2023 17:44:21

Re: Глюк при роботі Regex з українською абеткою

6 Відповідь від P.Y. 09.09.2023 17:53:51

Re: Глюк при роботі Regex з українською абеткою

7 Відповідь від wander 09.09.2023 18:05:17 Востаннє редагувалося wander (09.09.2023 18:06:28)

Re: Глюк при роботі Regex з українською абеткою

8 Відповідь від Teg Miles 09.09.2023 19:08:21 Востаннє редагувалося Teg Miles (09.09.2023 19:09:49)

Re: Глюк при роботі Regex з українською абеткою

9 Відповідь від wander 09.09.2023 19:54:53

Re: Глюк при роботі Regex з українською абеткою

10 Відповідь від Teg Miles 09.09.2023 20:02:55

Re: Глюк при роботі Regex з українською абеткою

11 Відповідь від wander 09.09.2023 23:47:36

Re: Глюк при роботі Regex з українською абеткою

12 Відповідь від Teg Miles 10.09.2023 08:34:56

Re: Глюк при роботі Regex з українською абеткою

13 Відповідь від Teg Miles 10.09.2023 12:05:57

Re: Глюк при роботі Regex з українською абеткою

14 Відповідь від wander 10.09.2023 13:23:38 Востаннє редагувалося wander (10.09.2023 13:25:53)

Re: Глюк при роботі Regex з українською абеткою

15 Відповідь від Teg Miles 10.09.2023 13:36:56

Re: Глюк при роботі Regex з українською абеткою

16 Відповідь від wander 10.09.2023 13:54:45 Востаннє редагувалося wander (10.09.2023 13:55:55)

Re: Глюк при роботі Regex з українською абеткою

17 Відповідь від Teg Miles 10.09.2023 14:30:42

Re: Глюк при роботі Regex з українською абеткою

Повідомлення: 17

Переглядають тему: 1 гість, 0 користувачів