std::wstring_convert<Codecvt,Elem,Wide_alloc,Byte_alloc>::to_bytes

来自cppreference.com
在标头 <locale> 定义
byte_string to_bytes( Elem wchar );
(1)
byte_string to_bytes( const Elem* wptr );
(2)
byte_string to_bytes( const wide_string& wstr );
(3)
byte_string to_bytes( const Elem* first, const Elem* last);
(4)

用构造时提供的 codecvt 平面进行宽到多字节转换。

1) 转换 wcharbyte_string ,如同它是长为 1 的字符串。
2) 转换始于 wptr 所指向宽字符的空终止宽字符序列为 byte_string
3) 转换宽字符串 strbyte_string
4) 转换宽字符序列 [first, last)byte_string

所有情况下,转换始于初始迁移状态,除非提供给此 wstring_convert 的构造函数非初始起始状态。记忆转换的字符数和转换状态的终止,并且能以 state()converted() 访问它们。

返回值

含有宽到多字节转换结果的 byte_string 对象。若转换失败,且有用户提供的字节错误字符串提供给此 wstring_convert 的构造函数,则返回该字节错误字符串。

异常

若此 wstring_convert 不以用户提供的字节错误字符串构造,则在转换失败时抛出 std::range_error

示例

#include <iostream>
#include <string>
#include <locale>
#include <codecvt>
#include <iomanip>
 
// 输出用的工具函数
void hex_print(const std::string& s)
{
    std::cout << std::hex << std::setfill('0');
    for(unsigned char c : s)
        std::cout << std::setw(2) << static_cast<int>(c) << ' ';
    std::cout << std::dec << '\n';
}
 
int main()
{
    // 宽字符数据
    std::wstring wstr =  L"z\u00df\u6c34\U0001f34c"; // 或 L"zß水🍌"
 
    // 宽到 UTF-8
    std::wstring_convert<std::codecvt_utf8<wchar_t>> conv1;
    std::string u8str = conv1.to_bytes(wstr);
    std::cout << "UTF-8 conversion produced " << u8str.size() << " bytes:\n";
    hex_print(u8str);
 
    // 宽到 UTF-16le
    std::wstring_convert<std::codecvt_utf16<wchar_t, 0x10ffff, std::little_endian>> conv2;
    std::string u16str = conv2.to_bytes(wstr);
    std::cout << "UTF-16le conversion produced " << u16str.size() << " bytes:\n";
    hex_print(u16str);
}

输出:

UTF-8 conversion produced 10 bytes:
7a c3 9f e6 b0 b4 f0 9f 8d 8c 
UTF-16le conversion produced 10 bytes:
7a 00 df 00 34 6c 3c d8 4c df

参阅

转换字节字符串为宽字符串
(公开成员函数)
给定状态,转换宽字符串为窄多字节字符串
(函数)
[虚]
将字符串从 InternT 转换到 ExternT,例如在写入文件时
(std::codecvt<InternT,ExternT,StateT> 的虚受保护成员函数)