Преобразование std::string в std::wstring туда и обратно, как делается? -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.216.175]

Общаемся правильно!

Полезные ссылки:

Модераторы: Qraizer, Hsilgos

Новое голосование

Преобразование std::string в std::wstring туда и обратно, как делается?

progman

Сообщ. #16 , 29.05.16, 03:42

Master

Профиль · PM

Рейтинг (т): 47

Ataru, вот еще вариант на винапи

void utf16to8( const std::wstring& utf16, std::string& utf8 )

{

char mUtf8[ MAX_PATH ] = { 0 };

int len = WideCharToMultiByte(CP_UTF8, 0, utf16.c_str(), -1, NULL, 0, 0, 0);

if (len >= 1 && len < MAX_PATH )

{

WideCharToMultiByte(CP_UTF8, 0, utf16.c_str(), -1, mUtf8, len, 0, 0);

}

utf8 = mUtf8;

}

void utf8to16(const std::string& utf8, std::wstring& utf16)

{

wchar_t mUtf16[ MAX_PATH ] = { 0 };

int len = MultiByteToWideChar(CP_UTF8, 0, utf8.c_str(), -1, NULL, 0);

if ( len >= 1 && len < MAX_PATH )

{

MultiByteToWideChar(CP_UTF8, 0, utf8.c_str(), -1, mUtf16, len );

}

utf16 = mUtf16;

}

Сообщение отредактировано: progman - 02.06.16, 07:07

Ataru

Сообщ. #17 , 29.05.16, 17:00

Junior

Профиль · PM

Рейтинг (т): нет

Этот способ тоже добавляет в начало символы и тоже только при первом преобразовании. Из "text" делает "ï»¿text"

И почему названия функций и переменных такие странные? utf8 это и есть юникод. Корректнее было бы назвать Utf8ToASCII(), мне во всяком случае нужно именно такое преобразование

Добавлено 29.05.16, 17:46
Все, сорри, вопрос снимается. Этот первый символ оказывается раньше появляется, т.е. проблема в другом месте. Просто в отладчике его не видно, если смотреть значение wstring, но он есть в буфере, из которого эта wstring создается.

amk

Сообщ. #18 , 29.05.16, 20:09

Guru

Профиль · PM

Поощрения: 4 Dgm

Рейтинг (т): 269

Добавляемые символы - это BOM (Byte Order Mark). Показывают порядок байт в широких символах. Добавляются скорее всего текстовым редактором (виндовый Notepad так делает), хотя в файле с кодировкой UTF-8 их ставить не обязательно. По стандарту их наоборот не должно быть.
WideChar и MultyByte это исторические названия, пришли из времён, когда названий UNICODE и UTF-8 ещё не придумали.

progman

Сообщ. #19 , 02.06.16, 07:05

Master

Профиль · PM

Рейтинг (т): 47

Цитата Ataru @ 29.05.16, 17:00

И почему названия функций и переменных такие странные? utf8 это и есть юникод. Корректнее было бы назвать Utf8ToASCII(), мне во всяком случае нужно именно такое преобразование

конвертация зависит от флагов у APIшной функции MultiByteToWideChar, в моем случае это CP_UTF8 а вам надо CP_ACP

Цитата Ataru @ 29.05.16, 17:00

Корректнее было бы назвать Utf8ToASCII()

С флагом CP_ACP, соглашусь, было бы корректнее. но у меня именно UTf8 <-> UTF16

Сообщение отредактировано: progman - 02.06.16, 07:06

1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)

0 пользователей:

Страницы: (2) 1 [2] все

[ Script execution time: 0,0238 ] [ 15 queries used ] [ Generated: 14.03.26, 09:00 GMT ]