FOCA: 深度挖掘文件中的隐含信息

FOCA (Fingerprinting Organizations with Collected Archives), 免费工具一枚. 由西班牙的一家公司informatica64公布, 主要用途是提取隐藏于文件中的深层信息. 在2009年的DEFCON 17上, 有一个介绍性演讲的题目叫做Tactical Fingerprinting using metadata, hidden info and lost data using FOCA (直译: 战术指纹提取?), 此演讲的音频、slides及white paper可以在这个页面找到.

同类工具有Libextractor/Metagoofil/OOMetaExtractor等, 在作者的slides中亦有所涉及, 大致解决方案也略有阐述.

FOCA

功能:

  • 搜索引擎中搜索文件
  • 抓取符合条件的文件
  • 挖掘和解读隐藏信息
  • 最终整合及分析信息

可提取的信息类型:

  • Metadata: 文档自身信息,如作者, 审核者等.
  • Hidden Information: 由程序生成, 不可人为编辑. 如路径, 打印机名等.
  • Lost Data: 人为失误写入, 如非纯文本方式的粘贴可能附带的内网URL.

可分析文件类型:

*.doc, *.docx, *.ppt, *.pptx, *.pps, *.ppsx, *.xls, *.xlsx, *.odp, *.odt, *.ods, *.odg, *.pdf, *.wpd, *.sxw 等.

继续阅读