V2EX  ›  英汉词典

Data Extraction

Definition / 定义

“Data extraction”指从数据源(如数据库、网页、PDF、日志、API、表格等)中获取并提取所需数据的过程,通常是数据分析、ETL(抽取-转换-加载)或数据挖掘的第一步。(在某些语境下也可指从非结构化内容中“抽取信息/字段”的信息抽取。)

Pronunciation / 发音

/ˈdeɪtə ɪkˈstrækʃən/(亦常见 /ˈdætə ɪkˈstrækʃən/)

Examples / 例句

We automated data extraction from the website using an API.
我们通过 API 实现了从该网站自动抽取数据。

Accurate data extraction is essential for building a reliable analytics pipeline, especially when the source contains messy or inconsistent fields.
准确的数据抽取对构建可靠的分析流水线至关重要,尤其当数据源字段杂乱或不一致时。

Etymology / 词源

“Data”源自拉丁语 datum(“给出的东西”),在现代英语中多指信息与事实记录;“extraction”来自拉丁语 extrahereex- “向外” + trahere “拉”),本义为“抽出、提取”。组合起来即“把需要的数据从来源中抽取出来”。

Related Words / 相关词

Literary Works / 文学作品中的用例

  • Python for Data Analysis(Wes McKinney):讨论从多种来源读取与整理数据,常涉及数据抽取流程。
  • Data Mining: Concepts and Techniques(Han, Kamber, Pei):在数据预处理与集成部分常使用“数据抽取/抽取数据”的概念。
  • The Data Warehouse Toolkit(Ralph Kimball 等):围绕ETL与数仓建设,频繁涉及数据抽取与加载实践。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4016 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 05:15 · PVG 13:15 · LAX 22:15 · JFK 01:15
♥ Do have faith in what you're doing.