本文介绍了 DBMS_CLOUD 包的基本用法。
自治数据库中引入了 DBMS_CLOUD 包,以提供一种与数据库中的对象存储进行交互的简单方法。它可用于版本 19c 和 21c 的本地安装。 它同样适用于 AWS S3 存储 buckets 或 Oracle Cloud Object Storage 存储 buckets。
先决条件
本文中的大多数示例都使用 DBMS_CLOUD 包的本地安装,但某些功能似乎只能在自治数据库上正常工作,过程中我将强调这些限制出现的地方。
DBMS_CLOUD 包默认存在于自治数据库中,它未安装在 Oracle 19c 或 21c 安装中,因此必须手动安装,此 MOS 说明中描述了安装。
可以参考下方的安装示例:
对于某些示例,我们需要一个对象存储 buckets。这可以是 Oracle Cloud Object Store 存储 buckets 或 AWS S3 存储 buckets。以下文章介绍了如何创建 Oracle Cloud Object Store 存储 buckets。
安装
我们创建一个测试用户,确保用户可以创建凭据,并授予其访问 DBMS_CLOUD 包的权限。
1 | |
我们需要一个本地目录对象来与数据库文件服务器上的文件进行交互,授予 test 用户和 C##CLOUD$SERVICE 用户访问此目录的权限。
1 | |
外部表功能需要访问名为 DATA_PUMP_DIR 的目录对象,因此在 PDB 中创建它并向测试用户授予读/写访问权限。
1 | |
连接到测试用户并创建下表:
1 | |
本文中所有 SQL 操作均由测试用户执行,除非特殊说明。
1 | |
对象存储 URI
对于本文中的许多示例,我们使用对象存储 URI。对于 Oracle Cloud,URI 可以采用这些形式之一。
1 | |
本文主要使用 swiftobjectstorage URI,但两者都有效。 在本文的其余部分,我们将使用 swiftobjectstorage URI。
AWS S3 和 Azure blob 存储 URI 通常如下所示:
1 | |
对象存储凭证
DBMS_CLOUD 包包含来自 DBMS_CREDENTIAL 包的过程的副本。这两个包可以互换使用,因为它们做同样的事情。
使用 CREATE_CREDENTIAL 过程为您的对象存储创建凭证。对于 Oracle 对象存储桶,我们使用我们的 Oracle Cloud 电子邮件和我们生成的身份验证令牌。
1 | |
对于 AWS 存储 buckets,我们使用我们的 AWS 访问密钥和秘密访问密钥。
1 | |
可以使用 USER_CREDENTIALS 视图显示有关凭证的
信息
。
1 | |
DISABLE_CREDENTIAL 和 ENABLE_CREDENTIAL 过程分别禁用和启用凭据。
1 | |
UPDATE_CREDENTIALS 过程允许我们编辑凭证的属性。
1 | |
DROP_CREDENTIAL 过程删除命名凭据。
1 | |
以下示例需要有效凭据。
对象和文件
有几个例程可用于操作本地数据库文件系统上的文件和云对象存储中的对象。
在数据库服务器文件系统上创建一个文件。
1 | |
我们使用 PUT_OBJECT 过程将文件从目录对象位置传输到云对象存储。
1 | |
PUT_OBJECT 过程有一个重载,用于将 BLOB 的内容传输到对象存储。
1 | |
LIST_OBJECTS 表函数列出对象存储 URI 指向的位置中的对象。
1 | |
我们使用 GET_METADATA 函数返回有关特定对象的信息。
1 | |
我们使用 GET_OBJECT 过程将对象从云对象存储传输到目录对象位置。
1 | |
有一个 GET_OBJECT 函数可以将对象从云对象存储传输到 BLOB。
1 | |
DELETE_OBJECT 过程从云对象存储中删除对象。
1 | |
DELETE_FILE 过程从目录对象位置删除文件。
1 | |
LIST_FILES 表函数列出指定 Oracle 目录对象指向的位置中的文件。 文档说它只支持映射到 Oracle 文件系统 (OFS) 或数据库文件系统 (DBFS) 文件系统的目录对象,所以我们不能将它用于常规文件系统。 它确实在自治数据库上提供的位置工作。
1 | |
外部表
本节介绍基于云对象存储中的文件创建外部表。
CREATE_EXTERNAL_TABLE
我们使用以下内容创建一个名为“emp.dat”的文件并将其放入我们的对象存储中。 它是一个没有标题的管道分隔文件。
1 | |
CREATE_EXTERNAL_TABLE 过程基于云对象存储中的文件创建名为 EMP_EXT 的外部表。
1 | |
我们查询外部表,它从云对象存储中读取数据。
1 | |
FORMAT 参数允许我们调整加载过程以适应数据文件内容。 可以在此处找到格式选项的完整列表,以下示例适用于 CSV 文件。
我们使用以下内容创建一个名为“emp.csv”的文件并将其放入我们的对象存储中。 它是一个带有标题行的 CSV 文件。
1 | |
CREATE_EXTERNAL_TABLE 过程基于云对象存储中的文件创建名为 EMP_CSV_EXT 的外部表。
1 | |
我们查询外部表,它从云对象存储中读取数据。
1 | |
VALIDATE_EXTERNAL_TABLE 过程允许我们检查外部表的有效性。
1 | |
CREATE_EXTERNAL_PART_TABLE
使用以下查询创建四个 CSV 文件:
1 | |
在上传文件之前,您可能需要稍微清理文件的开头和结尾。 将文件复制到对象存储:
1 | |
CREATE_EXTERNAL_PART_TABLE 过程基于云对象存储中的文件创建名为 COUNTRY_PART_TAB_EXT 的外部
分区表
。
1 | |
我们查询外部表,它从云对象存储中读取数据。
1 | |
VALIDATE_EXTERNAL_PART_TABLE 过程允许我们检查外部分区表的有效性。
1 | |
CREATE_HYBRID_PART_TABLE
CREATE_HYBRID_PART_TABLE 过程基于云对象存储中的文件创建一个名为 COUNTRY_HYBRID_PART_TAB_EXT 的外部混合分区表。
1 | |
我们在常规分区中插入一行。
1 | |
我们查询外部表,它从云对象存储中读取数据。
1 | |
VALIDATE_HYBRID_PART_TABLE 过程允许我们检查外部混合分区表的有效性。
1 | |
COPY_DATA
COPY_DATA 过程允许我们将数据从云对象存储复制到现有表中。
我们使用以下内容创建一个名为“emp.csv”的文件并将其放入我们的对象存储中。 它是一个带有标题行的 CSV 文件。
1 | |
我们截断本地 EMP 表并使用 COPY_DATA 过程从云对象存储重新加载数据。
1 | |
我们查询EMP表,可以看到数据已经加载完毕。
1 | |
与外部表示例
类
似,FORMAT 参数允许我们定制加载过程以适应数据文件内容。
Export Data
EXPORT_DATA 过程获取查询生成的数据,并以请求的格式将其导出到云对象存储。 这似乎不适用于 DBMS_CLOUD 包的本地版本,但适用于自治数据库。
1 | |
SODA Collections
Oracle 数据库可用作使用简单 Oracle 文档访问 (SODA) 的文档存储。 您可以在此处阅读有关 SODA 的信息。
我们创建一个名为“TestCollection1”的新
集合
。
1 | |
使用以下内容创建一个名为“fruit.json”的文件并将其上传到您的云对象存储。
1 | |
COPY_COLLECTION 过程将数据从我们的云对象存储加载到集合中。
1 | |
我们可以使用以下查询查看集合中的数据。
1 | |
删除操作
许多 DBMS_CLOUD 操作会产生额外的文件(日志文件、坏文件、临时文件等)。 一旦操作完成,这些需要清理。 上面显示的几个过程具有返回操作 ID 值的重载,该值可与 DELETE_OPERATION 过程一起使用以清理额外的文件。 或者,可以使用 USER_LOAD_OPERATIONS 视图显示当前会话的操作。
1 | |
我们使用 USER_LOAD_OPERATIONS 视图返回当前会话的操作。
1 | |
DELETE_OPERATION 过程允许我们清除与特定操作相关的附加文件。
1 | |
DELETE_ALL_OPERATIONS 过程允许我们清理所有操作的附加文件,或者如果我们指定类型值,则清理特定类型操作的附加文件。
1 | |



