概述
文档模块用于获取单个文档的详细内容和总结,支持文档列表查询、文件夹管理和文档上传。获取文档
get()
获取文档详情。| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
docId | string | 是 | 文档 ID |
Promise<DocumentDetail> - 文档详情
summary()
获取文档总结。| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
docId | string | 是 | 文档 ID |
Promise<DocumentSummary> - 文档总结
rawContent()
获取文档原始内容。| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
docId | string | 是 | 文档 ID |
Promise<DocContent> - 文档原始内容
文档列表
list()
获取文档列表,支持多种过滤条件。| 参数 | 类型 | 必填 | 默认值 | 说明 |
|---|---|---|---|---|
options.symbols | string[] | 否 | - | 股票代码过滤 |
options.categories | string[] | 否 | - | 文档类别:news, reports, filings, transcripts, socials |
options.markets | string[] | 否 | - | 市场过滤 |
options.institutions | string[] | 否 | - | 机构过滤 |
options.tags | string[] | 否 | - | 标签过滤 |
options.folderIds | string[] | 否 | - | 文件夹 ID 过滤 |
options.startDate | string | 否 | - | 开始日期(YYYY-MM-DD) |
options.endDate | string | 否 | - | 结束日期(YYYY-MM-DD) |
options.minScore | number | 否 | - | 最小相关性分数 |
options.pageNum | number | 否 | 1 | 页码 |
options.pageSize | number | 否 | 10 | 每页数量 |
Promise<PaginatedResponse<Document>> - 分页文档列表
queryBySymbols()
按股票代码查询文档。| 参数 | 类型 | 必填 | 默认值 | 说明 |
|---|---|---|---|---|
symbols | string[] | 是 | - | 股票代码列表 |
options.categories | string[] | 否 | - | 文档类别过滤 |
options.markets | string[] | 否 | - | 市场过滤 |
options.startDate | string | 否 | - | 开始日期 |
options.endDate | string | 否 | - | 结束日期 |
options.pageNum | number | 否 | 1 | 页码 |
options.pageSize | number | 否 | 10 | 每页数量 |
Promise<PaginatedResponse<Document>> - 分页文档列表
queryByTags()
按标签查询文档。| 参数 | 类型 | 必填 | 默认值 | 说明 |
|---|---|---|---|---|
tags | Record<string, unknown[]> | 是 | - | 标签字典,如 { industry: ['科技'], topic: ['AI'] } |
options.categories | string[] | 否 | - | 文档类别过滤 |
options.markets | string[] | 否 | - | 市场过滤 |
options.startDate | string | 否 | - | 开始日期 |
options.endDate | string | 否 | - | 结束日期 |
options.pageNum | number | 否 | 1 | 页码 |
options.pageSize | number | 否 | 10 | 每页数量 |
Promise<PaginatedResponse<Document>> - 分页文档列表
searchChunks()
语义搜索文档片段。| 参数 | 类型 | 必填 | 默认值 | 说明 |
|---|---|---|---|---|
query | string | 是 | - | 搜索查询 |
options.num | number | 否 | 10 | 返回结果数量 |
options.symbols | string[] | 否 | - | 股票代码过滤 |
options.categories | string[] | 否 | - | 文档类别过滤 |
options.folderIds | string[] | 否 | - | 文件夹 ID 过滤 |
options.docIds | string[] | 否 | - | 文档 ID 过滤 |
options.markets | string[] | 否 | - | 市场过滤 |
options.institutions | string[] | 否 | - | 机构过滤 |
options.tags | object | 否 | - | 标签过滤 |
options.startDate | string | 否 | - | 开始日期 |
options.endDate | string | 否 | - | 结束日期 |
options.minScore | number | 否 | - | 最小相关性分数 |
options.includeDocExtraDetails | boolean | 否 | - | 是否包含文档额外详情 |
options.refineQuestion | boolean | 否 | - | 是否优化查询 |
options.dateRange | string | 否 | - | 日期范围 |
Promise<Chunk[]> - 文档片段列表
文件夹管理
createFolder()
创建文档文件夹。| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
name | string | 是 | 文件夹名称 |
Promise<{ folderId: string }> - 新创建的文件夹 ID
deleteFolder()
删除文档文件夹及其所有文件。| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
folderId | string | 是 | 文件夹 ID |
Promise<{ folderId: string; docIds: string[] }> - 删除的文件夹 ID 和文档 ID 列表
文档上传
uploadDocs()
通过 URL 上传文档(同步)。| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
docs | UploadDocRequest[] | 是 | 文档上传请求列表 |
docs[].url | string | 是 | 文档 URL |
docs[].name | string | 否 | 文档名称 |
docs[].metadatas | object | 否 | 元数据 |
docs[].publishedAt | number | 否 | 发布时间戳(毫秒) |
docs[].tags | object | 否 | 文档标签 |
options.folderId | string | 否 | 目标文件夹 ID |
options.pdfParsingMode | number | 否 | PDF 解析模式:1(按页)或 3(按逻辑) |
Promise<{ docs: Array<{ id: string; title: string; originalUrl: string }> }> - 上传结果
uploadDocsAsync()
通过 URL 异步上传文档。| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
docs | UploadDocRequest[] | 是 | 文档上传请求列表(同 uploadDocs) |
options.folderId | string | 否 | 目标文件夹 ID |
options.pdfParsingMode | number | 否 | PDF 解析模式 |
Promise<{ docs: Array<{ id: string; title: string; originalUrl: string }> }> - 上传结果
getUploadStatus()
获取文档上传状态。| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
docId | string | 是 | 文档 ID |
Promise<{ id: string; status: string }> - 上传状态
deleteDocs()
删除文档。| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
docIds | string[] | 是 | 要删除的文档 ID 列表 |
Promise<{ docIds: string[] }> - 已删除的文档 ID 列表
