Markup是面向医疗、法律、新闻等行业的开源AI辅助文本注释工具,由英国斯旺西大学研发。它融合了主动学习、预测性注释、本体映射等AI技术,支持将非结构化文本快速转化为可用于NLP模型训练的结构化数据。平台支持标准医学本体库、云端或本地部署,保障数据安全合规。其核心功能包括AI辅助注释、标签自定义、批量处理与智能本体映射,极大降低人工标注负担,提升信息提取的标准化和高效性。
Markup:开创AI赋能的结构化文本注释新时代
—— 新闻专题报道
Markup平台全景介绍
在人工智能与大数据时代,如何从海量非结构化文本中快速、准确地提取关键信息成为了各行业科学研究与信息工程的核心挑战之一。Markup(Official website)正是为此而生的创新AItool,由英国斯旺西大学医疗学院研发,面向医疗健康、法律、社交媒体、新闻等多领域的专业人士与研究团队,致力于帮助用户便捷高效地将自由文本转化为结构化、标签化的数据,为NLP(自然语言处理)模型的训练与研究工作提供数据基础。
如下为Markup的官方网站入口:
https://www.getmarkup.com
该平台跨界整合了主动学习、预测性注释、本体映射等多项前沿AI技术,不仅拥有灵活的定制能力,还能与UMLS、SNOMED-CT、ICD-10等主流医学本体及用户自定义本体无缝连接。目前Markup同时支持云端网页版与本地部署版本,极大贴合了数据合规和团队安全需求。
(延伸阅读:开发团队论文详述)

Markup的主要功能
Markup的核心优势在于把AI辅助注释和传统手工注释有机结合,提升整体注释效率与一致性。以下为其主要功能简述:
1. 主动学习与预测性注释
- 基于Active Learning机制,系统自动学习用户的注释习惯和规律,不断优化实体识别与属性抽取建议。
- 采用LSTM神经网络进行信息映射,实现关键信息自动标签归档。
- 可快速自动识别常见结构(如药物名、剂量等)。
2. 实时本体映射与词汇纠错
- 支持UMLS、SNOMED-CT、ICD-10等标准医学本体对接,亦可上传自定义本体。
- AI自动将术语与本体标准词条对接,并智能纠正拼写错误。
3. 智能配置与批处理能力

- 支持上传brat standoff格式配置,提供可视化“配置文件生成器”。
- 可批量处理多文档,便于大规模项目。
- 支持成果导出至通用格式,便于对接NLP工具链。
4. 人性化界面及交互设计
- 左侧: 配置面板管理标签和本体。
- 中部: 文档面板高亮可视化内容片段。
- 右侧: 注释面板支持编辑与一键筛选。
5. 数据安全与多样化部署
- 支持加密传输;本地部署确保敏感数据不出内网。
- 完全开源,可进行安全审查与二次开发。
- GitHub源码:https://github.com/samueldobbie/markup/
Main functions overview:
| Functional Classification | Detailed description | Does it support? |
|---|---|---|
| 预测性注释 | 自动提出实体和属性注释建议,AI学习用户反馈持续改进 | ✔ |
| 主动学习 | 无需大型标注集,仅用模板数据即可驱动主动学习 | ✔ |
| 本体映射 | 支持标准/自定义本体,智能推荐映射编号 | ✔ |
| 配置文件定制 | 可视化生成器支持自定义实体-属性结构 | ✔ |
| Local deployment | 支持跨平台本地安装,敏感数据不出本地 | ✔ |
| 多用户协作 | 暂不支持团队协作,未来开发 | ✘ |
| 多格式导入 | 仅支持txt,未来规划支持Word/PDF等 | part |
Markup的价格 & 方案
Markup是一款Open source and free工具,源代码及所有主要功能均对个人及研究团队开放,允许二次开发与安全本地部署,不收取授权费用。

下载渠道:
– 云端在线使用:https://www.getmarkup.com
– 本地安装与源码:https://github.com/samueldobbie/markup/
| Scheme type | 收费/免费 | Deployment method | 支持范围 | Is it open source? |
|---|---|---|---|---|
| 官网SaaS版 | free | cloud | 个人/团队/科研 | 是 |
| 本地安装版 | free | Win/Linux/Mac | 机构/公司/敏感数据 | 是 |
目前无付费高级版或商业API接口。
如何使用Markup
- 获取与安装:云端无需安装,注册即可登录。需本地化部署可至GitHubdownload.
- 配置项目:使用内置生成器或上传brat配置,建立注释标签体系,可自定义或对接本体库。
- Upload document:支持批量上传纯文本/语料文件,系统自动分派编辑区。
- 注释流程:选择文本片段,指定实体和属性,可直接采纳、修改或拒绝AI建议。
- 导出成果:注释结果可一键导出brat格式,便于NLP流程集成。

| step | Operation content | AI support | 手动操作 |
|---|---|---|---|
| Document Upload | 导入纯文本/配置本体 | 否 | ✔ |
| 片段选择 | 鼠标选定文本片段 | 否 | ✔ |
| 实体/属性注释 | 系统自动或手动配对标签与属性 | ✔ | ✔ |
| 本体映射 | AI智能推荐标准词条,支持人工修正 | ✔ | ✔ |
| Export Results | 多格式导出,衔接后续流程 | 否 | ✔ |
Markup的适用人群与应用场景
Target audience
- 临床与生物医学研究者:高效抽取病历和信件结构化数据
- 法律文档分析师:自动标注文档条款与要素
- 数据标注团队:生成高质量NLP训练集
- 医疗IT工程师:搭建大规模结构化语料库
- 学生及NLP爱好者:用于NLP和信息抽取学习实践

Typical application scenarios
- 医院电子病历结构化处理
- AI企业智能辅助诊断系统开发
- 法律公司批量合同文本分析
- 社交/新闻平台自动结构化评论、新闻素材
Markup与同类产品对比
| Product Name | AI辅助注释 | 本体映射 | 多输入格式 | Teamwork | Deployment flexibility | Typical uses |
|---|---|---|---|---|---|---|
| Markup | ✔ | ✔ | Plain text | Under development | Cloud/Local | 医疗、法律 |
| BRAT | ✘ | part | Plain text | 有 | local | 生物标注 |
| WebAnno | ✘ | part | 纯文本等 | ✔ | Cloud/Local | 多领域 |
| INCEpTION | ✔ | ✔ | Multi-format | ✔ | Cloud/Local | academic research |
Frequently Asked Questions
1. Markup支持哪些本体库?可以自定义吗?
answer:Markup内置UMLS、SNOMED-CT、ICD-10等医学本体,支持上传自定义本体库(每行一条,词条/编号),适合多场景标准化术语。
2. 我的数据会上传云端吗?
answer:网页版需联网,敏感数据建议部署本地版,数据始终保存在本地,保障合规和数据安全。
3. 团队协作如何实现?
answer:团队账密与多人协作功能计划中,当前可通过文件导入/导出方式分工整合,敬请关注后续版本。
综上,借助Markup平台,数据工作者、医学及法律领域研究者可以在提高效率的同时,有效降低人工标注负担,为自然语言处理与人工智能研究构建坚实数据基础。欢迎查阅Markup官网获取最新功能资讯!
data statistics
Data evaluation
This site's AI-powered navigation is provided by Miao.Markup都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AI 喵导航实际控制,在2026年5月29日 pm1:23收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI 喵导航不承担任何责任。

