UTF-8 String Indexing Strategies

nullprogram.com

Các ngôn ngữ lập trình hiện nay đều cần phải biểu diễn chuỗi ký tự Unicode bằng một dãy byte theo định dạng nào đó lưu trong bộ nhớ, thông thường là UTF-8, UTF-16, dựa vào chiều dài của chuỗi. Bài viết này giới thiệu về cơ chế encode chuỗi Unicode theo định dạng UTF-8 của ngôn ngữ Emacs Lisp, Julia và Go.

Read more...
Linkedin

Want to receive more content like this in your inbox?