google-bigquery - 在表格中,Google BQ如何更新现有数据?

  显示原文与译文双语对照的内容
70 3

我正在使用 python 客户端库加载BigQuery表中的数据。我需要更新那些表格中的一些修改过的行。但是我不知道如何正确地更新它们?我想要一些类似的UPSERT 函数- 只在不存在的情况下插入行,否则- 更新现有行。

是否正确地在表( 在装载过程中比较和) 中使用带有校验和的特殊字段?如果有一个好主意,如何用 python 客户机解决这个问题?( 如我所知,它不能更新现有数据)

请解释一下,最佳实践是什么?

时间:原作者:0个回答

72 0

BigQuery通过设计只附加首选。这意味着最好让表中相同实体的重复行,并编写查询以始终读取最近的行。

在事务表中,如你所知,更新行是不可能的。每天每个表只有 100个更新。这是非常有限的,它们的目的是完全不同的。

因为:被用作数据湖,所以你应该每次用户都流行新行。更新它的配置文件你将从 20开始为同一用户保存 20行。以后,通过删除重复数据,可以rematerilize表具有唯一的行。

有关后面的问题,请参阅最多问题:BigQuery删除语句删除重复的语句。

原作者:
...