1

Тема: Підскажіть рішення для обробки тексту

Здоров. Є деяка книга в форматі pdf, використовуючи деякий онлайн сервіс я переробив її в txt. Проблема в тому, що в цьому тексті існують переноси, ну типу
"бла бла бла, бла бла, бере-
мо стілець бла бла бла."
Необхідно видалити ось такі переноси, тобто спочатку видалити "-", а потім пробіл, котрий стоїть після "-". Також існують звичайні переноси, типу
"бла бла бла, беремо
стілець бла бла."
А необхідно, щоб текст був без них, тобто
"бла бла бла, беремо стілець бла бла".
Цей текст в подальшому має завантажуватись на сайт, і CMS вже сама все зробить з ним.
Підскажіть, можливо, якусь програмку для рішення вишеописаних задач, а-то так ліньки обмазуватись регулярними виразами і писати все самому =(

Говоріть українською! Живіть українською! Відчувайте українською!

2

Re: Підскажіть рішення для обробки тексту

1-й варіант
1) Замінити всі "-\n" на ""
2) Замінити всі "\n" на " "

Приклад на PHP:

$str = str_replace("-\n", "", str_replace("\n", " ", $str));

2-й варіант
Взяти текстовий редактор і використати фішку: замінити все.

3

Re: Підскажіть рішення для обробки тексту

Replace написав:

1-й варіант
1) Замінити всі "-\n" на ""
2) Замінити всі "\n" на " "

Приклад на PHP:

$str = str_replace("-\n", "", str_replace("\n", " ", $str));

2-й варіант
Взяти текстовий редактор і використати фішку: замінити все.

ну зара спробую, в мене ж якраз стоїть апач і пхп інтепретатор.

Говоріть українською! Живіть українською! Відчувайте українською!

4

Re: Підскажіть рішення для обробки тексту

здається, все ок, дякую

Говоріть українською! Живіть українською! Відчувайте українською!

5

Re: Підскажіть рішення для обробки тексту

Ні ні ні, стоп стоп стоп. Воно видалило лише знак кінця строки, а "-" так і залишилось

Говоріть українською! Живіть українською! Відчувайте українською!

6

Re: Підскажіть рішення для обробки тексту

Може там не -, а – чи —.

7

Re: Підскажіть рішення для обробки тексту

Я вже відремонтував, воно, чомусь, не розуміє "\n", тобу я просто скопіював ту частинку, котру треба замінювати і підставив в функцію. і о чудо, воно працює як треба

Говоріть українською! Живіть українською! Відчувайте українською!

8

Re: Підскажіть рішення для обробки тексту

Replace написав:

Може там не -, а – чи —.

ну я копіював саме цей знак і підставляв, але теж не працювало

Говоріть українською! Живіть українською! Відчувайте українською!

9

Re: Підскажіть рішення для обробки тексту

Мабуть треба \r\n замість \n.

10 Востаннє редагувалося User 298 (09.08.2013 10:42:29)

Re: Підскажіть рішення для обробки тексту

TRYCUKI_V_KROVI написав:

Я вже відремонтував, воно, чомусь, не розуміє "\n", тобу я просто скопіював ту частинку, котру треба замінювати і підставив в функцію. і о чудо, воно працює як треба

Якщо відкриєте файл у Notepad++ та натиснете "показувати знаки, що не друкуються", то побачите, що конкретно ви копіювали. Як правило, спуск на новий рядок у вінді покаже як CRLF (\r\n), а у лінуксі - просто LF (Replace вірно вказав постом вище).

З.І: а на маках, здс, взагалі CR...