结构化数据提取#
大语言模型(LLMs)能够处理大量非结构化数据并以结构化格式返回结果,而LlamaIndex的设计使这一过程变得简单易行。
通过LlamaIndex,您可以利用大语言模型读取自然语言文本,识别语义上重要的细节(如姓名、日期、地址和数字等),并以统一的结构化格式返回这些信息,无论原始数据采用何种格式。
当您处理聊天记录、对话转录等非结构化原始材料时,这一功能尤为实用。
获得结构化数据后,您可以将其发送至数据库,或在代码中解析结构化输出以实现工作流程自动化。
完整教程#
我们的学习板块提供了结构化数据提取的完整教程,建议您从这里开始入门。
我们还准备了一个示例笔记本,演示教程中提到的部分技术。
其他指南#
如需全面了解LlamaIndex的结构化数据提取功能(包括底层模块),请参阅以下指南:
我们还支持多模态结构化数据提取,点击查看。
其他示例#
以下补充示例展示了更多应用场景: