Re: Тема для розмов
У якому кодуванні закодовано слово "абзац" "%D0%B0%D0%B1%D0%B7%D0%B0%D1%86"? Google AI каже що UTF-8, але знайдені функції C++ по кодуванню дають "%E0%E1%E7%E0%F6". Це треба щоб скачати wiktionary списки слів
Ви не увійшли. Будь ласка, увійдіть або зареєструйтесь.
Ласкаво просимо вас на україномовний форум з програмування, веб-дизайну, SEO та всього пов'язаного з інтернетом та комп'ютерами.
Будемо вдячні, якщо ви поділитись посиланням на Replace.org.ua на інших ресурсах.
Для того щоб створювати теми та надсилати повідомлення вам потрібно Зареєструватись.
Український форум програмістів → Інше → Тема для розмов
Сторінки Попередня 1 … 686 687 688 689 690 … 723 Наступна
Для відправлення відповіді ви повинні увійти або зареєструватися
У якому кодуванні закодовано слово "абзац" "%D0%B0%D0%B1%D0%B7%D0%B0%D1%86"? Google AI каже що UTF-8, але знайдені функції C++ по кодуванню дають "%E0%E1%E7%E0%F6". Це треба щоб скачати wiktionary списки слів
https://amp.urlencoder.org/ - це щодо кодування URL адрес кирилицею.
З іншого форума мені сказали використовувати функції MultiByteToWideChar і WideCharToMultiByte для перетворень кирилиці в URL, але не сказали як
Всі носяться з тими дітьми депутатів, немов... новонароджена буржуазія полювала на дочок збіднілиих дворянських родів. Оскільки українська буржуазія євроінтегрується ударними темпами або настільки пов'язана в урядом, що її не відрізниш від комуністів, депутатські діти її мало цікавлять. Це відкриває шлях до відродження наших козацьких звичаїв - викрадення панської дочки простим спритним селянином, як це описано в Боплана.
З іншого форума мені сказали зберегти файл із ANSI словами в UTF-8, потім пропустити через
#include <iomanip>
#include <sstream>
#include <iostream>
#include <string>
#include <vector>
#include <cstring>
#include <fstream>
#include <windows.h>
using namespace std;
string url_encode(const string &value) {
ostringstream escaped;
escaped.fill('0');
escaped << hex;
for (string::const_iterator i = value.begin(), n = value.end(); i != n; ++i) {
string::value_type c = (*i);
// Keep alphanumeric and other accepted characters intact
if (isalnum(c) || c == '-' || c == '_' || c == '.' || c == '~') {
escaped << c;
continue;
}
// Any other characters are percent-encoded
escaped << uppercase;
escaped << '%' << setw(2) << int((unsigned char) c);
escaped << nouppercase;
}
return escaped.str();
}
std::vector<std::string> LoadFile(string FileName) {
std::vector<std::string> result;
std::ifstream inputFile(FileName.c_str());
if (inputFile.is_open()) {
std::string line;
while (std::getline(inputFile, line)) {
result.push_back(line);
}
inputFile.close();
}
return result;
}
int main(void)
{
string in_file_n, base_url, temp_url, out_file_n;
cout << "InFile name: ";
cin >> in_file_n;
cout << "Base url: ";
cin>> base_url;
cout << "OutFile name: ";
cin >> out_file_n;
std::vector<std::string> words=LoadFile(in_file_n);
ofstream out_file(out_file_n.c_str());
for (int i=0; i<words.size(); i++)
{
temp_url=base_url+url_encode(words[i]);
out_file << temp_url << endl;
}
return 0;
}
І накінець ці посилання почав завантажувати WinHTTrack Website Copier (Get Separated Files). У кожного проекта копієра ліміт на 5 підключень в секунду "to avoid server overload", а слів сотні тисяч, тож доведеться посилання розділяти на декілька десятків файлів, щоб не чекати місяць...
html-сторінки опису до кожного слова скачав, потім об'єднав по 1000 файлів в один, потім кожен з цих пропустив через щось типу
#include <iostream>
#include <string>
#include <fstream>
using namespace std;
struct ss
{
size_t pos;
string sstr;
};
ss sub(string str, string beg, string end, size_t pos)
{
ss ret;
size_t pos1=str.find(beg, pos);
if(pos1!=std::string::npos)
{
size_t pos2=str.find(end, pos1);
if(pos2!=std::string::npos)
{
ret.sstr=str.substr(pos1, pos2-pos1+end.size());
}
ret.pos=pos2;
return ret;
}
ret.pos = pos1;
return ret;
}
string LoadFile(string FilePath) {
ifstream infile(FilePath.c_str());
if (!infile.is_open()) {
cerr << "File\"" << FilePath << "\" not found." << endl;
return "";
}
string content;
string line;
while (getline(infile, line)) {
content += line + "\n";
}
infile.close();
return content;
}
int main()
{
string from="<table style=\"float:right; clear:right;";
string to="</table>";
ss op;
op.pos=0;
cout << "Input File: ";
string input_file_name;
cin >> input_file_name;
cout << "Output file name: ";
string output_file_name;
cin >> output_file_name;
ofstream outfile(output_file_name.c_str());
string str=LoadFile(input_file_name);
while(op.pos!=std::string::npos)
{
op=sub(str, from, to, op.pos);
cout << op.pos << " from " << str.size() << endl;
outfile << op.sstr << endl;
}
return 0;
}
І отримав купу таблиць з іменниками, прикметниками у різних відмінках, дієсловами. Що робити з таблицями далі не знаю, мабуть треба створювати клас чи структуру, в яку записувати з цих таблиць ті відмінки та інші
Просто для розваги завантажив
https://huggingface.co/TheBloke/Code-13B-GGUF/tree/main
та встановив Alpaca Electron:
https://github.com/ItsPi3141/alpaca-ele … v1.0.6.exe
Цей
Робота цих ШІ - жах. Схоже на зламаний пошуковик, який видає лише один результат пошуку і невірний
code-13b.Q2_K.gguf розміром 5.43 GB (це найменша модель) працює досить повільно (на одне питання відповідає за 5 хвилин на старому 12-ядерному процесорі на 3.6 ГГц), але на диво відповідає на самі найрізноманітніші питання комп'ютерної тематики, на які вистачить фантазії.
А модель https://huggingface.co/Pi3141/alpaca-7b … /tree/main ggml-model-q2_k.gguf. Відповідає і на заборонені питання, але значно тупіша за code-13b.Q2_K.gguf
Робота цих ШІ - жах. Схоже на зламаний пошуковик, який видає лише один результат пошуку і невірний
І так, і ні.
Ось нещодавно боровся зі всіма доступними розумними чатами, водили по колу бо ще не в курсі про нововведення в останній версії фреймворку.
Уявляєте, довелося читати документацію
Upd: Знайшов спосіб на такий випадок коли лінь писати самостійно - беру відповідний шмат документації, згодовую її чату, даю свій код і текст помилки, кажу щоб виправив, воно бере і виправляє. Ото ще навчаться чати самостійно ґуґлити останню версію документації, то стануть програмісти ще лінивішими.
Я мав на увазі роботу офлайн (локального) ШІ з сайта huggingface. А от не локальний онлайн-чат з того ж huggingface надав мені багато технологій синтезу різних речовин, про які не написано в інтернеті. Мене цікавили найбільш небезпечні
А від чата https://www.perplexity.ai/ я дізнався про таку речовину - https://uk.wikipedia.org/wiki/%D0%A5%D1 … 0%B0%D1%82
"Хінукліділ-3-бензиат"
1-азабіцикло[2.2.2]окт-3-ил 2-гідрокси-2,2-дифенілацетат) — отруйна бойова речовина психотропної дії. Діє близько 70-80 годин при прийомі перорально 1 мг
As a powerful anticholinergic agent, BZ produces a syndrome of effects known as the anticholinergic toxidrome: these include both psychological and physiological effects, with the most incapacitating effect being a state of delirium characterized by cognitive dysfunction, hallucinations, and inability to perform basic tasks. The usual syndrome of physical anticholinergic effects are also present, including mydriasis (potentially to the point of temporary blindness), tachycardia, dermal vasodilation, xerostomia and hyperthermia.[5] The readily-observable symptoms of the anticholinergic toxidrome are famously characterized by the mnemonic "Mad as a hatter, red as a beet, dry as a bone and blind as a bat" (and variations thereof).[6]
Від чат GPT я отримав інструкції синтезу, які я пропускав через інші ШІ-чати і вони кажуть також що повинні вийти такі-то прекурсори при змішуванні, а з них "Хінукліділ-3-бензиат".
Тому онлайн-чати - не лише працюють гарно, а і потужна зброя яка допоможе знайти те що ніколи не знайшли б самі
На KISS FM постійно програють музику ось цього ШІ-генератора:
https://soundraw.io/edit_music?length=1 … Technology
Там в посиланні було 180, я змінив на 1800 але 1800 секунд не дає якусь нову музику, а лише повторює згенеровану на 180 (більшого цей генератор не вміє). Відрізнити нормальну музику від цього просто - постійні переривання
Козаки, хто знає, це зараз в усіх провайдерах так, чи тіки у мене. Торренти завантажувати стало майже не реально бо сіди з кацапськими айпі тупо не дають швидкість. І що цікаво, заходити на кацапскі торент сайти я можу без ВПН (на відміну від самих кацапів ). Тільки іноземні і українські айпи дають швидкість (навіть білоруські і казахські), але їх дуже мало тому швидкість або мінімальна або взагалі нема. ВПН вирішує це питання, але платити і за інтернет і за ВПН мене жаба давить. В чому може бути проблема? У мене CGNAT? Double NAT? У мого провайдера є послуга "Абонентська плата за 1 реальну IP-адресу без обмежень кількості одночасних вихідних сесій", це вирішіть проблему?
Як я розумію (а я мало розумію), якщо у меня не реальний айпі, то виходить у мене мали б бути проблеми з підключенням в онлайн іграх, а цієї проблеми немає.
Цікавий спосіб церебрального сексу: шукаю можливість налаштувати vpn за допомогою IPsec всередині докер контейнеру. Для тренування взяв безкоштовний protonvpn.
навіщо тобі vpn що ти на тих російських ресурсах забув?
навіщо тобі vpn що ти на тих російських ресурсах забув?
Ні, це по роботі. З болотами не пов'язано. І protonvpn не підтримує IPsec.