数码之家

 找回密码
 立即注册
搜索
查看: 246|回复: 0

[业界] Unicode联盟正式发布15.0标准 添加4489个新字符

[复制链接]
发表于 2022-9-20 18:53:34 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册

x
作为一个非营利性组织,Unicode Consortium 致力于开发、拓展和促进相关全球化标准的采用。联盟成员中有许多企业和组织代表,且其中不少来自计算机和信息处理行业。而在 15.0 新标准中,Unicode 联盟继续实施了针对核心规范、附件和数据文件的改进 —— 为其引入了 4489 个新字符,且总数达到了 14 万 9186 个。

image.png

首先,本次新增内容包括了两组新脚本(总计 161 个)、20 个新的表情符号(Emoji)、以及 4393 个中日韩(CJK)表意文字。

其次,Unicode 15.0 版本中的新脚本和字符增加了对更多现代语言的支持:

● 包括在印度地区使用的 Nag Mundari
● 在印度使用的 Kannada 字符(用于书写 Konkani、Awadhi 和 Havyaka Kannada);
● 以及由阿拉斯加卡克托维克的伊努皮亚克人设计、用于因纽特语和尤皮克语的 Kaktovik 数字。

新增的 20 个表情符号,包括发夹(hair pick)、沙锤(maracas)、水母(jellyfish)、khanda(印度的一种古老武器)、以及粉色爱心(pink heart)。

其它新增符号还包括:

● 九颗尖白星(巴哈伊信仰者使用)
● 八个天体符号(天文学家和占星者使用)
● 29 个额外的埃及象形文字(格式控件)

针对其它语言和学术工作的支持:

● 在东南亚发现的历史文字 Kawi(用于书写古爪哇语和其它语言)
● 三个附加的阿拉伯文字(土耳其使用的古兰经标记)
● 三个 Khojki 字符(在手写和印刷文件中被发现)
● 十个梵文字符(用于表示在土耳其发现的吉祥标志铭文和手稿)
● 六个拉丁字母(马拉雅拉姆语的音译使用)
● 63 个西里尔字母修饰符(音标中使用)

重要的图表字体更新:

● 一组埃及象形文字(除了支持文本中旋转字形的标准化变体序列外)
● 统一加拿大土著音节的字形(为 Carrier 和其它语言提供更好的支持)
● 一套 Wancho 新字体(具有改进和简化的形状)

● 针对中日韩(CJK)语言的更新添加:

● H 块中的 CJK 统一表意文字扩展(4192 个字符)
● C 块中的一个统一表意文字扩展

最后,Unicode 属性和规范决定了文本在计算机(包括手机)上的行为,以下 15.0 版新标准的重要更新。

【UAX #9】Unicode 双向算法,修改了 UAX9-C2 中的注释,以强调使用更高级别的协议来减轻潜在的源代码欺骗攻击。
【UAX #31】Unicode 标识符与模式参数,提供更多关于默认标识符配置文件的指导,阐明标识符中默认可忽略代码点的使用,并讨论 Pattern_White_Space 与编程语言中的双向排序问题之间的关系。
【UAX #38】Unicode Han 数据库,增加了 kAlternateTotalStrokes 属性。将 kCihaiT 属性的类别变更为字典索引、扩展 kKangXi 属性,并且加入了第 3.0、3.10 和 4.5 节。
【UTS #39】Unicode 安全机制,将零宽度连接符(ZWJ)和零宽度非连接符(ZWNJ)字符从 Identifier_Status=Allowed 变更为 Identifier_Status=Restricted,默认情况下的通用安全配置文件将不再允许。
【UAX #45】U-Source 语义符,在其数据文件中记录了新的表意文字、添加了 ExtH 作为新状态、改进现有 CJK 统一表意文字块的状态标识符、并添加了第 2.5 节。
【UTS #46】Unicode IDNA 兼容性处理,澄清了 ToASCII 中空标签的边缘情况、并添加了有关新 IDNA 派生属性数据文件的文档。


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2024-5-27 15:34 , Processed in 0.358800 second(s), 12 queries , Redis On.

Powered by Discuz!

© 2006-2023 smzj.net

快速回复 返回顶部 返回列表