Hadoop文件系统API定义

这是Hadoop文件系统API的规范,它将文件系统的内容建模为一组路径,这些路径可以是目录、符号链接或文件。

在这个领域,惊人地缺乏先前的艺术成果。有多个关于Unix文件系统的inode树的规范,但没有公开定义“Unix文件系统作为数据存储访问的概念模型”的内容。

这个规范试图做到这一点;定义Hadoop文件系统的模型和API,以便多个文件系统可以实现这些API,并向应用程序呈现其数据的一致模型。

它并不试图正式指定文件系统的并发行为,除了记录HDFS所展示的行为,因为这些行为通常被Hadoop客户端应用程序所期望。

  • Introduction

  • Notation

  • Model

  • FileSystem class

  • OutputStream, Syncable and StreamCapabilities

  • Abortable

  • FSDataInputStream class

  • PathCapabilities interface

  • FSDataOutputStreamBuilder class

  • Testing with the Filesystem specification

  • Extending the specification and its tests

  • Uploading a file using Multiple Parts

  • IOStatistics

  • openFile()

  • SafeMode

  • LeaseRecoverable

参考资料

https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/filesystem/index.html