谷歌开源了一个能从非结构化信息中提取结构化信息的 Python 库 LangExtract
每一条提取结果都能映射到原文的具体位置
针对长文本做了优化,大幅提升召回率和处理效率
云端模型和本地模型都支持
一键生成 HTML 文件,直观展示千上万条提取实体
只需少量示例即可适配任意领域
项目地址:https://github.com/google/langextract
每一条提取结果都能映射到原文的具体位置
针对长文本做了优化,大幅提升召回率和处理效率
云端模型和本地模型都支持
一键生成 HTML 文件,直观展示千上万条提取实体
只需少量示例即可适配任意领域
项目地址:https://github.com/google/langextract