unicode文本怎么弄（BIN格式文件图文详解一）

掌中柔 2023-01-24 23:17:52

收藏赞分享

精简UNICODE，按unicode编码方式存储检索，又称为Simple Unicode。主要目的：极致优化检索表空间。

设置选项：Simple Unicode Height Fixed

unicode文本怎么弄（BIN格式文件图文详解一）(1)

一、分段图解

主要分4段：文件头，编码表，检索表，点阵信息。

unicode文本怎么弄（BIN格式文件图文详解一）(2)

补充说明：字符数决定编码表和检索表的大小。

适宜场景：编码不连续，且字符数少。

文件头结构体

/*针对 height fixed 存储格式*/ typedef struct gui_font_head_height_fixed{ BYTE magic[4]; //'S'('U'or ’M’), 'F', 'L', X---Unicode(or MBCS) Font Library, X: 表示版本号. 分高低4位。如 0x12表示 Ver 1.2 DWORD Size; // 文件大小 BYTE nSection; // 共分几段数据，主要针对 UNICODE 编码有效。 BYTE YSize; // 字体高度 WORD wCpFlag; // codepageflag: bit0~bit13 每个bit分别代表一个CodePage 标志，如果是1，则表示当前CodePage 被选定，否则为非选定。 WORD nTotalChars; // 总的字符数 BYTE ScanMode; // 扫描模式 BYTE bpp; // 位深度 } GUI_FONT_HEAD_HF, *PGUI_FONT_HEAD_HF;

要点：字体高度，字符数，扫描方式，位深度。

二、图例详解

1、文件头

unicode文本怎么弄（BIN格式文件图文详解一）(3)

说明：上图蓝色标记部分（16字节）为文件头。详解如下：

55 46 4C 12 - 标识头，判断是否为合法的字库文件。

53 = ‘S’，表示文件为Simple Unicode编码格式。

46 = ‘F’ , 4C = 'L'

12 表示该字库文件版本信息为 V1.2

20 6B 03 00 - 文件总长度。即文件长 = 0x00036B20

00 - 表示包含几个段。00则表示 0个段。

0C - 表示字体高度。 0C = 12，表示12像素。

02 00 - 表示当前字库包含了哪些字符集。

38 1D - 表示有效字符数。0x1D38 = 7480 个字符。

00 - 表示扫描模式（比对工具设置选项就明白了）

01 - 表示位深度（参考值：1，2，4，8），bpp = 1

2、编码表

unicode文本怎么弄（BIN格式文件图文详解一）(4)

说明：蓝色标记部分为编码表数据。按小端字节序存放，升序排列，2个字节为1个编码。如 A4 00 A7 00 A8 00 ...，则表示第一个编码为 0x00A4，第二个编码为 0x00A7，第三个编码为 0x00A8，以此类推。

3、检索表

一条检索信息占4个字节，包含了字符宽度和点阵信息的起始偏移地址。检索信息结构体如下：

typedef struct tagUflCharInfo{ DWORD OffAddr : 26; // 当前字符点阵数据的起始地址 DWORD Width : 6; // 字符点阵的像素宽度( 目前最大支持点阵 < 64) } UFL_CHAR_INDEX;

说明：高 6bit 记录字符宽度，低 26bit 记录点阵信息起始偏移地址。

4、点阵信息

当前字库中所有包含字符的点阵数据集合，数据存储方式与扫描方式有关，分横向，纵向，具体视情况而定。如：B3 1A，即为 10110011 00011010，配合位深度，逐个处理即可。

三、参考代码

1、simple unicode.h

// unicode_simple.h // #if !defined(__FONT_UNICODE_SIMPLE_H__) #define __FONT_UNICODE_SIMPLE_H__ #include "..\include\typedef.h" /*************************************** Func：读取编码列表, Param： nCodeNum：编码数量 dwHeadLen：文件头长度 Return：成功返回“0”，否则返回“非0”. ****************************************/ int font_unicode_simple_read_codes(int nCodeNum, DWORD dwHeadLen); // 释放编码列表相关内存 void font_unicode_simple_release_codes(); /*************************************** Func：定位字符，成功返回检索信息，否则返回0. Param： nCode：编码 dwHeadLen：文件头长度 Return：返回指定字符的偏移地址，若找到有效字符，则返回大于0的检索信息，否则返回0. ****************************************/ DWORD font_unicode_simple_find_char(WORD wCode, DWORD dwHeadLen); #endif // (__FONT_UNICODE_SIMPLE_H__)

2、simple unicode.c

/*********************************************************** 描述：用c语言写的一个如何从unicode编码格式的点阵字库中读取字符信息（像素宽点阵信息）至于容错性和效率方面还得使用者自行改善。谢谢您的参阅！作者：wujianguo 日期：20090516 MSN: wujianguo19@hotmail.com qq：9599598 *************************************************************/ #include "..\include\font.h" #include "..\include\font_file.h" #include "..\include\unicode_simple.h" #ifdef WIN32 #include <stdio.h> #include <stdlib.h> #endif #define MAX_FIND_LIMIT 31 // 是否二分查找临界值 static int g_nCodeNum = 0; WORD *g_pCodes = NULL; // 读取编码列表 int font_unicode_simple_read_codes(int nCodeNum, DWORD dwHeadLen) { font_unicode_simple_release_codes(); g_nCodeNum = nCodeNum; g_pCodes = (WORD *)Malloc(nCodeNum*sizeof(WORD)); if(g_pCodes == NULL) { printf("Malloc is fail!\n"); return -1; } font_file_seek(dwHeadLen); font_file_read(g_pCodes, nCodeNum*sizeof(WORD)); return 0; } // 释放动态分配的内存 void font_unicode_simple_release_codes() { if(g_pCodes != NULL) { free(g_pCodes); g_pCodes = NULL; } } // 定位编码位置，若找到返回 >= 0的值，否则返回 -1. int font_unicode_simple_find_code(WORD wCode) { if(g_nCodeNum > 0) { if(g_nCodeNum > MAX_FIND_LIMIT) // 二分查找 { int low, high, mid; low = 0; high = g_nCodeNum -1; while(low <= high) { mid = (high low)/2; if(g_pCodes[mid] == wCode) return mid; else if(wCode > g_pCodes[mid]) low = mid 1; else high = mid - 1; } } else // 顺序查找 { int i = 0; for(i = 0; i < g_nCodeNum; i ) { if(wCode == g_pCodes[i]) return i; } } } return -1; } // 根据编码获取检索信息 DWORD font_unicode_simple_find_char(WORD wCode, DWORD dwHeadLen) { DWORD offset = 0; DWORD dwCharInfo = 0; int nIdx = font_unicode_simple_find_code(wCode); if(nIdx == -1) // 未找到该编码 return 0; offset = dwHeadLen g_nCodeNum * 2 nIdx * 4; //dwHeadLen：文件头长度；g_nCodeNum * 2: 编码表长度；nIdx*4：检索表偏移 printf("offset = 0x%X\n", offset); font_file_seek(offset); font_file_read(&dwCharInfo, sizeof(DWORD)); return dwCharInfo; }

展开全文

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com

猜您喜欢

可以提取b站的音频的软件（B站好看的音频）

芷雪今生
怎么查手机号码的安全性（如何给手机号码打码）

想娟念萌
华为mate系列与小米mix系列哪个好（手机名为MIXmate）

彻底败给
如何解决电脑卡顿的问题（从根本上解决电脑卡顿的问题）

让你爱上我
魅族note3有没有指纹解锁（千元指纹手机里边除了大神Note3貌似还有这么一个）

媞吣非
你们都在用的什么音乐软件（玩音乐你一定用过这些软件）

再賤我很賤
甘肃省评标管理办法（甘肃省建设工程计算机辅助评标软件公开上线）

爱不会绝迹

秒懂生活

unicode文本怎么弄（BIN格式文件图文详解一）

猜您喜欢

可以提取b站的音频的软件（B站好看的音频）

怎么查手机号码的安全性（如何给手机号码打码）

华为mate系列与小米mix系列哪个好（手机名为MIXmate）

如何解决电脑卡顿的问题（从根本上解决电脑卡顿的问题）

魅族note3有没有指纹解锁（千元指纹手机里边除了大神Note3貌似还有这么一个）

你们都在用的什么音乐软件（玩音乐你一定用过这些软件）

甘肃省评标管理办法（甘肃省建设工程计算机辅助评标软件公开上线）

热门推荐

排行榜