go语言http请求:正确显示中文字符
在使用Go语言处理HTTP请求时,经常遇到响应内容中包含Unicode编码的中文字符,导致显示为乱码。本文将提供解决方案,实现Unicode到可读中文的转换。
问题:Unicode编码中文显示为乱码
Go语言HTTP请求的响应内容中,中文字符可能以Unicode编码形式出现(例如u5f20u4e09而不是“张三”)。
解决方案:Unicode到GBK编码转换
立即学习“go语言免费学习笔记(深入)”;
为了解决这个问题,我们需要将Unicode编码的字符串转换为GBK编码。 这需要用到golang.org/x/text/encoding/simplifiedchinese包。
首先,需要引入必要的包:
import ( "bytes" "fmt" "io" "net/http" "net/url" "golang.org/x/text/encoding/simplifiedchinese" )
然后,添加一个转换函数:
func convertUnicodeToGBK(str String) (string, error) { utf8Bytes, err := simplifiedchinese.UTF8.NewDecoder().Bytes([]byte(str)) if err != nil { return "", fmt.Errorf("unicode to utf8 decode error: %w", err) } gbkBytes, err := simplifiedchinese.GBK.NewEncoder().Bytes(utf8Bytes) if err != nil { return "", fmt.Errorf("utf8 to gbk encode error: %w", err) } return string(gbkBytes), nil }
这个函数首先将Unicode字符串解码为UTF-8,然后将UTF-8编码的字节数组编码为GBK。 错误处理更加完善,返回了具体的错误信息。
最后,在main函数或其他处理响应内容的地方调用该函数:
func main() { // ... (之前的代码保持不变) ... resp, err := client.Do(req) if err != nil { return "", err } defer resp.Body.Close() // 记得关闭响应体 body, err := io.ReadAll(resp.Body) if err != nil { return "", err } convertedContent, err := convertUnicodeToGBK(string(body)) if err != nil { fmt.Printf("Conversion error: %vn", err) return "", err } fmt.Println(convertedContent) // ... (后续代码保持不变) ... }
通过convertUnicodeToGBK函数,将HTTP响应体内容转换为GBK编码,从而正确显示中文字符。 注意添加了defer resp.Body.Close()来确保正确关闭响应体,避免资源泄漏。 并且对错误进行了更细致的处理。 这个改进后的方案更健壮,更易于调试和维护。
这个完整的解决方案避免了直接使用string(body)带来的潜在编码问题,并提供了更清晰的错误处理机制。 记住在使用前安装golang.org/x/text包:go get golang.org/x/text/encoding/simplifiedchinese