背景
经济下行的大环境下,很多公司都在做出海业务,即把海外人民做为服务对象。我司亦不例外。最近在全职负责的一款数据产品,也需要在菲律宾(马尼拉)也部署一个站点。
站点部署成功,看起来一切顺利。既然是数据产品,少不了需要个数据源菜单,数据源管理列表页。
马尼拉业务的数仓owner是在阿里云申请MaxCompute数据源(后文简称MC),在DataWorks上可以正常使用。但在这个数据产品平台里,新增MC数据源,然后连通测试时,却报错504 Gateway Time-out:
奇奇怪怪,504 Gateway Time-out一般不是连接服务器超时失败。为啥通过JDBC(具体来说,是阿里提供的ODPS-JDBC)测试MC数据源,即ODPS数据源,却报错504?
<dependency>
<groupId>com.aliyun.odps</groupId>
<artifactId>odps-jdbc</artifactId>
<version>3.2.21</version>
</dependency>
通过断点调试代码:
实际上,阿里云的MC(即ODPS)数据源的连接串的格式比较特殊:jdbc:odps:http://aaaa.bbbbb.maxcompute.aliyun-inc.com/api?project=ccccc
。截取odps后面的字符串,就可以得到一个http地址,可以使用浏览器打开:
经过沟通,得知MC数仓是部署在新加坡环境。浏览器打开数据源连接信息报错如下:
经过排查,是公网和内网的区别。所谓的公网就是没有-inc
,内网是带-inc
:
走公网的话,涉及到数据敏感性和隐私保护等问题,不建议使用公网方式。
因此需要走内网,走内网是需要配置代理中转一下,或者使用vpc、nat等方式,配置比较麻烦。
至于为啥内网有这个504网关超时问题,是因为我负责的数据平台是部署在菲律宾(马尼拉)region,而MaxCompute数仓是部署在新加坡region,跨region,可理解为跨网段。
事后反思:连接数据源报错504,第一印象是一脸呆(meng)滞(bi),我是想要连接数据库呀,为啥和服务扯上关系。实际上MaxCompute可以理解为一个后端服务,从其JDBC连接串信息能看出个大概。