std::codecvt_utf8

在头文件 `<codecvt>` 中定义

template< class Elem, unsigned long Maxcode = 0x10ffff, std::codecvt_mode Mode = (std::codecvt_mode)0 > class codecvt_utf8 : public std::codecvt<Elem, char, std::mbstate_t>;

std::codecvt_utf8是一个std::codecvt方面，它封装了一个UTF-8编码的字节串和UCS2或UCS4字符串（取决于类型Elem）之间的转换。这codecvt方面可用于读取和写入UTF-8文件，文本文件和二进制.

Elem	-	无论是char16_t，char32_t，或wchar_t 原文： either char16_t, char32_t, or wchar_t 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。
Maxcode	-	`Elem`最大的价值，这方面没有读取或写入错误原文： the largest value of `Elem` that this facet will read or write without error 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。
Mode	-	恒定的类型std::codecvt_mode 原文： a constant of type std::codecvt_mode 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。

Inherited from std::codecvt

Member types


会员类型原文： Member type 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。	Definition

`intern_type`	`internT`

`extern_type`	`externT`

`state_type`	`stateT`

Member objects


会员名称原文： Member name 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。	Type

`id` （静态的）	std::locale::id

Member functions


out	调用`do_out` 原文： invokes `do_out` 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（公共成员函数of `std::codecvt`） [edit]

in	调用`do_in` 原文： invokes `do_in` 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（公共成员函数of `std::codecvt`） [edit]

unshift	调用`do_unshift` 原文： invokes `do_unshift` 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（公共成员函数of `std::codecvt`） [edit]

encoding	调用`do_encoding` 原文： invokes `do_encoding` 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（公共成员函数of `std::codecvt`） [edit]

always_noconv	调用`do_always_noconv` 原文： invokes `do_always_noconv` 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（公共成员函数of `std::codecvt`） [edit]

length	调用`do_length` 原文： invokes `do_length` 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（公共成员函数of `std::codecvt`） [edit]

max_length	调用`do_max_length` 原文： invokes `do_max_length` 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（公共成员函数of `std::codecvt`） [edit]

Protected member functions


do_out [虚]</div></div>	转换成一个字符串，如写入文件时，从Internt的externT 原文： converts a string from internT to externT, such as when writing to file 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（虚拟保护成员函数of `std::codecvt`） [edit]

do_in [虚]</div></div>	将字符串转换，如从文件读取时，从externT到Internt的原文： converts a string from externT to internT, such as when reading from file 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（虚拟保护成员函数of `std::codecvt`） [edit]

do_unshift [虚]</div></div>	产生的externT不完全转化为字符序列终止符原文： generates the termination character sequence of externT characters for incomplete conversion 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（虚拟保护成员函数of `std::codecvt`） [edit]

do_encoding [虚]</div></div>	返回的externT需要产生一个Internt的字符的字符数，如果不变原文： returns the number of externT characters necessary to produce one internT character, if constant 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（虚拟保护成员函数of `std::codecvt`） [edit]

do_always_noconv [虚]</div></div>	该方面的测试，如果所有有效参数值的标识转换为编码原文： tests if the facet encodes an identity conversion for all valid argument values 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（虚拟保护成员函数of `std::codecvt`） [edit]

do_length [虚]</div></div>	计算将转换成给定的Internt的缓冲区消耗的externT字符串，该字符串的长度原文： calculates the length of the externT string that would be consumed by conversion into given internT buffer 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（虚拟保护成员函数of `std::codecvt`） [edit]

do_max_length [虚]</div></div>	返回的最大数目，可以被转换成一个单一的Internt的字符externT字符原文： returns the maximum number of externT characters that could be converted into a single internT character 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（虚拟保护成员函数of `std::codecvt`） [edit]

</div>

Inherited from std::codecvt_base


会员类型原文： Member type 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。	Definition

enum result { ok, partial, error, noconv };	无作用域的枚举类型原文： Unscoped enumeration type 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。


枚举常量原文： Enumeration constant 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。	Definition

`ok`	转换完成，没有错误原文： conversion was completed with no error 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。

`partial`	不是所有的源字符被转换了原文： not all source characters were converted 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。

`error`	遇到无效的字符原文： encountered an invalid character 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。

`noconv`	没有转换，输入和输出类型是相同的原文： no conversion required, input and output types are the same 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。

[编辑] 示例

下面的示例演示之间的差异UCS2/UTF-8和UTF-16/UTF-8转换的第三个字符的字符串不是一个有效的UCS2字符.

#include <iostream>
#include <string>
#include <locale>
#include <codecvt>
int main()
{
    // UTF-8 data. The character U+1d10b, musical sign segno, does not fit in UCS2
    std::string utf8 = u8"z\u6c34\U0001d10b";
 
    // the UTF-8 / UTF-16 standard conversion facet
    std::wstring_convert<std::codecvt_utf8_utf16<char16_t>, char16_t> utf16conv;
    std::u16string utf16 = utf16conv.from_bytes(utf8);
    std::cout << "UTF16 conversion produced " << utf16.size() << " code points:\n";
    for(char16_t c : utf16)
        std::cout << std::hex << std::showbase << c << '\n';
 
    // the UTF-8 / UCS2 standard conversion facet
    std::wstring_convert<std::codecvt_utf8<char16_t>, char16_t> ucs2conv;
    try {
        std::u16string ucs2 = ucs2conv.from_bytes(utf8);
    } catch(const std::range_error& e) {
        std::u16string ucs2 = ucs2conv.from_bytes(utf8.substr(0, ucs2conv.converted()));
        std::cout << "UCS2 failed after producing " << std::dec << ucs2.size()<<" characters:\n";
        for(char16_t c : ucs2)
            std::cout << std::hex << std::showbase << c << '\n';
    }
}

输出：

UTF16 conversion produced 4 code points:
0x7a
0x6c34
0xd834
0xdd0b
UCS2 failed after producing 2 characters:
0x7a
0x6c34

[编辑] 另请参阅

Character conversions	narrow multibyte (char)	UTF-8 (char)	UTF-16 (char16_t)
UTF-16	`mbrtoc16` / `c16rtomb`	`codecvt`<char16_t, char, mbstate_t> `codecvt_utf8_utf16`<char16_t> `codecvt_utf8_utf16`<char32_t> `codecvt_utf8_utf16`<wchar_t>	N/A
UCS2	No	`codecvt_utf8`<char16_t>	`codecvt_utf16`<char16_t>
UTF-32/UCS4 (char32_t)	`mbrtoc32` / `c32rtomb`	`codecvt`<char32_t, char, mbstate_t> `codecvt_utf8`<char32_t>	`codecvt_utf16`<char32_t>
UCS2/UCS4 (wchar_t)	No	`codecvt_utf8`<wchar_t>	`codecvt_utf16`<wchar_t>
wide (wchar_t)	`codecvt`<wchar_t, char, mbstate_t> `mbsrtowcs` / `wcsrtombs`	No	No


codecvt	之间进行转换的字符编码，包括UTF-8，UTF-16，UTF-32 原文： converts between character encodings, including UTF-8, UTF-16, UTF-32 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（类模板） [edit]

codecvt_mode （C++11）	标签改变的的标准codecvt方面的行为原文： tags to alter behavior of the standard codecvt facets 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（类） [edit]

codecvt_utf16 （C++11）	之间的转换UTF-16和UCS2/UCS4 原文： converts between UTF-16 and UCS2/UCS4 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。（类模板） [edit]

codecvt_utf8_utf16 （C++11）	converts between UTF-8 and UTF-16 （类模板） [edit]

语言
概念
实用工具库
字符串库
集装箱库
算法库
迭代器库
Numerics库
输入/输出库
本地化库
正则表达式库（C++11）
原子操作库（C++11）
线程的支持库（C++11）

cppreference.com

搜索

名字空间

变换

查看

操作

std::codecvt_utf8

目录

[编辑] 模板参数

Inherited from std::codecvt

Member types

Member objects

Member functions

Protected member functions

Inherited from std::codecvt_base

[编辑] 示例

[编辑] 另请参阅

导航

工具箱