JavaScript 如何实现在搜索中忽略变音符号
发布于 2024-01-25
1606
版权声明
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
鲁飞
扫码关注公众号
扫码阅读
手机扫码阅读
变音符号是加在字母上的符号,用来改变字母的发音或区分拼写相似的词语,比如汉语拼音中的ü或带调符的á、à。
以JavaScript为例,变音符号可以造成字符比较和长度判断的差异。尽管name1和name2变量看起来都是"Amélie",它们全等比较和长度比较的结果都是false,因为它们在底层的编码上有差异。
在docsify中,存在一个需求是在搜索时忽略变音符号,使得搜索"Amelie"可以找到"Amélie"。然而,docsify默认并不支持这一功能,需要通过剔除字符串中的变音标记后再进行搜索匹配。
为了实现这一功能,我们可以使用JavaScript的normalize方法,并传入NFD参数来分解字符串。由于带变音符号的字符在UTF-8中用两个字节表示,通过normalize方法可以将字符和变音标记分成独立的字节。
分解后,可以利用replace方法配合正则表达式删除变音标记,从而实现变音符号的忽略。示例如下:
"Amélie".normalize('NFD').replace(/[\u0300-\u036f]/g, '') > "Amelie"
这样,我们就可以在不考虑变音符号的情况下完成搜索匹配。
参考资料:
鲁飞
鲁飞
扫码关注公众号
还在用多套工具管项目?
一个平台搞定产品、项目、质量与效能,告别整合之苦,实现全流程闭环。
查看方案
鲁飞的其他文章
怎么使用默认的 PHP 执行 phar 包?
最近在开发一个安装程序的时候,打包为了 phar 包,遇到了一个问题就是打包后的 phar 包不能省略 php 去运行。
MQTT 怎么在单独一个端口上分别使用 v3.x 和 v5.0 协议解析?
在 1883 端口上,同时处理 v3.1、v3.1.1 和 v5.0 这 3 种协议等级
simps/mqtt v1.1.1 版本发布,支持 MQTT5 中的大部分 Property
在 MQTT 5.0 协议中增加了很多属性。不同的报文类型之间,属性也会不同,一共有 27 种属性。
使用 GitHub Actions 自动同步 Docker 镜像到 CNB
通过 GitHub Actions + skopeo + CNB 服务,构建一个可复用、自动化、支持多镜像同步的工具链,显著提升了镜像的可用性与部署效率。
解决Docker端口映射无法访问问题
这是一个过于沙雕的问题。
加入社区微信群
与行业大咖零距离交流学习
PMO实践白皮书
白皮书上线
白皮书上线