国产一区二区视频在线观看_亚洲乱亚洲乱妇18p_中文字幕制服综合第一页_欧美日韩国产在线精品特黄

蘇州都市網(wǎng) 熱門快訊便民頻道資訊中心房產(chǎn)頻道生活頻道汽車頻道家居頻道蘇州商業(yè)婚慶頻道蘇州旅游母嬰頻道
首頁 > 資訊中心 > 國內(nèi)資訊 正文

亞馬遜云科技Amazon Redshift云數(shù)據(jù)倉庫

字號: 2022-12-26 15:23 來源:
  2022年12月,在拉斯維加斯舉辦的2022亞馬遜云科技re:Invent全球大會(huì)完美落幕,這一標(biāo)志性的技術(shù)盛宴再一次給人們留下了無限的想象空間,等待大家在新的一年去持續(xù)探索和發(fā)掘

  2022年12月,在拉斯維加斯舉辦的2022亞馬遜云科技re:Invent全球大會(huì)完美落幕,這一標(biāo)志性的技術(shù)盛宴再一次給人們留下了無限的想象空間,等待大家在新的一年去持續(xù)探索和發(fā)掘。

  而最讓人關(guān)注的,應(yīng)該就是各類新服務(wù)了,今年無論是Adam還是Swami博士的Keynote很多篇幅都是和數(shù)據(jù)相關(guān)的新服務(wù)和新特性,尤其是Swami博士關(guān)于數(shù)據(jù)創(chuàng)新起源的表述以及新的端到端云原生數(shù)據(jù)戰(zhàn)略。所以,接下來將目光切回今天這篇文章關(guān)注的對象——數(shù)據(jù),更具體地說是眾多新發(fā)布中占據(jù)高位的Amazon Redshift云數(shù)據(jù)倉庫。

  簡化數(shù)據(jù)攝入工作

  最好是沒有

  要想數(shù)據(jù)分析到位,首先要保證有穩(wěn)定、可靠的數(shù)據(jù)攝入通道,來實(shí)現(xiàn)端到端的第一環(huán)(其實(shí)還有第零環(huán),是業(yè)務(wù)在數(shù)據(jù)源側(cè)的規(guī)劃),而這一塊也是大部分?jǐn)?shù)據(jù)工程中遇到最頭疼的問題之一。首先,數(shù)據(jù)源就包含很多種,最常見的數(shù)據(jù)源包括關(guān)系型數(shù)據(jù)庫、數(shù)據(jù)湖和實(shí)時(shí)的流數(shù)據(jù)。其次,不管是手動(dòng)還是自動(dòng)的ETL流水線,都需要專業(yè)的數(shù)據(jù)工程團(tuán)隊(duì)來構(gòu)建和維護(hù),并且經(jīng)常要處理或介入數(shù)據(jù)結(jié)構(gòu)的變更等情況。這次,Redshift連發(fā)多個(gè)功能特性來幫助客戶解決或者消除這類問題。

  首先是最常見的關(guān)系型數(shù)據(jù)庫,也就是經(jīng)典的OLTP向OLAP的數(shù)據(jù)傳遞。如果是為了更快或者更實(shí)時(shí)地獲取線上業(yè)務(wù)的事務(wù)數(shù)據(jù)來做分析,通常可以通過開啟數(shù)據(jù)庫的binlog來捕捉CDC變更,然后再使用解析CDC的工具如Amazon DMS、Debezium等來實(shí)現(xiàn),這些都需要客戶進(jìn)行不斷的監(jiān)控、配置和優(yōu)化。此外,不同的數(shù)據(jù)庫和數(shù)據(jù)表可能會(huì)有不同的需求,這樣就再加倍了數(shù)量級的維護(hù)成本。

  相信大家對Redshift印象最深的一個(gè)功能就是Zero ETL,幫助客戶完成從1到0的過程!Redshift通過與Amazon Aurora數(shù)據(jù)庫深度集成,在事務(wù)型數(shù)據(jù)寫入Aurora后,數(shù)據(jù)在底層被持續(xù)地復(fù)制到Redshift,完成行式數(shù)據(jù)存儲到列式數(shù)據(jù)存儲的轉(zhuǎn)換,徹底消除了自己構(gòu)建和維護(hù)復(fù)雜數(shù)據(jù)管道的工作。沒有Hybrid OLTP和OLAP,仍然是熟悉的Amazon Purpose-Build(Aurora還是 Aurora,Redshift還是Redshift)各司其職解決最實(shí)際的問題。同時(shí),客戶的應(yīng)用程序架構(gòu)保持不變,讀寫端點(diǎn)指向Aurora,分析端點(diǎn)指向Redshift,但是底層已經(jīng)不再是一大串接一大串的數(shù)據(jù)抽取、轉(zhuǎn)換和加載,直接無縫銜接并且達(dá)到近實(shí)時(shí)的效果。

  然后是數(shù)據(jù)湖S3,Redshift開始支持從S3數(shù)據(jù)湖中自動(dòng)復(fù)制,手動(dòng)擋升級自動(dòng)擋。之前,如果想要拷貝數(shù)據(jù)都需要手動(dòng)或者定時(shí)執(zhí)行COPY命令,現(xiàn)在Redshift新添加了COPY JOB命令自動(dòng)檢測指定路徑的新文件,跳過已經(jīng)加載完畢的舊文件。以前編寫的定時(shí)任務(wù)腳本可以退役了,而且再也不用擔(dān)心手抖重復(fù)執(zhí)行,生活變得更美好了。

  如果業(yè)務(wù)需求是實(shí)時(shí)的,那么通過S3作為Staging存儲再COPY的方式就跟不上節(jié)奏了,所以,流數(shù)據(jù)也要拿下。re:Invent之前,Redshift流式攝入已經(jīng)開始支持Amazon Kinesis Data Streams,這次發(fā)布更是添加了Amazon Managed Streaming for Apache Kafka(MSK),同時(shí)流式攝入也正式推出,告別預(yù)覽。從上面的圖中可以看出,流式攝入合并了數(shù)據(jù)消費(fèi)的過程,直接在Redshift中實(shí)現(xiàn)并持續(xù)加載到數(shù)據(jù)倉庫。在Redshift中,流式攝入是通過物化視圖的方式實(shí)現(xiàn)的(查找官方文檔是在物化視圖章節(jié)),用戶還可以在這個(gè)物化視圖基礎(chǔ)上再配合其他數(shù)據(jù)疊加物化視圖提高查詢效率。另外,別忘了還可以給流式攝入開啟自動(dòng)刷新功能。從此,客戶可以更簡單地完成實(shí)時(shí)數(shù)據(jù)分析,包括IoT物聯(lián)網(wǎng)設(shè)備、點(diǎn)擊流、應(yīng)用程序監(jiān)控、欺詐檢測和游戲?qū)崟r(shí)排行榜等。

  以上,Redshift簡化了各種最經(jīng)典的數(shù)據(jù)源ETL方式,數(shù)據(jù)坐等分析。

  更多數(shù)據(jù)分析的利器

  來點(diǎn)火花

  數(shù)據(jù)已經(jīng)妥妥地進(jìn)到了數(shù)據(jù)倉庫的碗里來,接下來就請開始它的表演了。此時(shí),數(shù)據(jù)工程師表示Redshift SQL很好,但是還有些更復(fù)雜業(yè)務(wù)數(shù)據(jù)邏輯更適合通過代碼的方式進(jìn)行操作和處理(而不是通過UDF)。開源大數(shù)據(jù)生態(tài)體系下有非常豐富的軟件供組織采用了,其中功能完善、發(fā)展穩(wěn)定的Apache Spark往往是一個(gè)優(yōu)先的選擇。在亞馬遜云科技平臺上使用Spark并不復(fù)雜,有托管服務(wù)EMR和Glue保駕護(hù)航,還有新發(fā)布的Amazon Athena for Apache Spark可以極速啟動(dòng)交互。但是,說到Spark和Redshift之間進(jìn)行數(shù)據(jù)分析還是需要折騰一下的,或者是通過將Redshift中的數(shù)據(jù)導(dǎo)出到S3中,或者是使用各種第三方的Spark連接器,前者需要多走一步浪費(fèi)時(shí)間和資源,后者沒有多少人維護(hù)不說,性能和安全性都令人堪憂。因此,Amazon Redshift integration for Apache Spark應(yīng)運(yùn)而生。

  這個(gè)內(nèi)置集成模式基于一個(gè)之前的開源項(xiàng)目,提升了性能和安全性,相信后續(xù)亞馬遜云科技仍將繼續(xù)跟進(jìn)這個(gè)開源項(xiàng)目,并將各種升級改造的好東西貢獻(xiàn)給社區(qū)。目前,EMR、EMR on EKS、EMR Serverless和Glue(限定版本)都預(yù)置了打包好的連接器和JDBC驅(qū)動(dòng)程序,客戶完全可以直接開始編寫代碼(有愛好者迫不及待連夜在EMR Studio中使用EMR on EKS完成了對Redshift Serverless和集群模式的交互式讀寫測試,體驗(yàn)極佳),對Redshift中的數(shù)據(jù)進(jìn)行處理。如果客戶的數(shù)據(jù)分析工作負(fù)載以Spark為主,也可以通過Spark統(tǒng)一對各種數(shù)據(jù)源的分析。

伊能靜深夜發(fā)布辟謠聲明 稱已委托律師取證

4日晚,伊能靜發(fā)布辟謠聲明,稱造謠是違法行為,已經(jīng)委托律師取證。不少網(wǎng)友火速在評論區(qū)留言,紛紛詢問她“怎么了”。

湯唯獲韓國電影制作人獎(jiǎng)最佳女主角 今年五度封后

12月5日,韓國電影制作家協(xié)會(huì)獎(jiǎng)發(fā)布獲獎(jiǎng)名單,湯唯憑《分手的決心》 拿下第9屆韓國電影制作人協(xié)會(huì)獎(jiǎng)最佳女主角獎(jiǎng)。這是湯唯今年繼春史、釜日、影評、青龍之后拿下的第五座影后獎(jiǎng)杯。

谷愛凌疑似戀情曝光后首露面 扎丸子頭面帶燦笑狀態(tài)好

5日,有網(wǎng)友曬出與谷愛凌的合影。照片上的谷愛凌扎著丸子頭,身穿紅色外套,面帶燦笑,狀態(tài)很好。

蔡依林和周杰倫為什么分手 三大原因揭曉

當(dāng)時(shí)周杰倫跟侯佩岑親密的逛街照片流出,周杰倫跟蔡依林解釋是被要求拍照的。當(dāng)時(shí)蔡依林選擇了相信,在后來蔡依林回憶說她不想放棄這段感情,但是周杰倫提出了分手,她不得不接受這樣的結(jié)果。但是也有很多人說周杰倫跟蔡依林當(dāng)初沒有在一起,他們只不過是一對很好的朋友,但是種種跡象表明,兩個(gè)人真心的相愛過。

朱茵為什么嫁給黃貫中 來揭曉真相?

據(jù)了解,朱茵的老公不是黃家強(qiáng)而是黃貫中!朱茵嫁給了黃貫中最重要的一個(gè)原因是黃貫中對朱茵非常好,而星爺當(dāng)時(shí)大紅大紫有無數(shù)女明星向他獻(xiàn)殷勤,所以其實(shí)當(dāng)時(shí)周星馳是沒太把朱茵當(dāng)回事的!對于女人來說找一個(gè)正在愛自己的難道有錯(cuò)嗎?說以朱茵選擇了黃貫中。

趙薇為什么被全網(wǎng)封主要原因 這幾原因是關(guān)鍵

趙薇還有“女版巴菲特”之稱,這個(gè)稱呼,足以證明她的“財(cái)力”了。然而,最近的通報(bào)里,就有她在證券市場失信被罰的通告。趙薇不僅是演員,還玩投資。但是玩得很“特別”。早前就有報(bào)道說,她和丈夫空手套白狼,以51倍的杠桿撬動(dòng)30億元,之后,又被曝經(jīng)濟(jì)問題,并被點(diǎn)名,處罰他們5年禁入證券市場了;

浪味仙究竟是男是女 浪味仙性別曝光

浪老師的外形上長的比較中性,說話的聲音也很溫柔,在吃東西的時(shí)候也非常的斯文,即使要吃下很多東西也不失優(yōu)雅,不會(huì)像同平臺其他大胃王那樣狼吞虎咽,而是會(huì)一口一口細(xì)致的反復(fù)咀嚼食物。由于浪老師自身性格的原因以及一頭飄逸的長發(fā),因此常常被人誤解是女生。

賈洪清為什么揍徐大寶?個(gè)人資料簡介顯示其老公是誰?

今天,網(wǎng)紅“徐大寶”上了微博熱搜,原因是她稱自己被家暴。一時(shí)間,不少網(wǎng)友很好奇,徐大寶老公是誰?據(jù)公開個(gè)人資料簡介,徐大寶老公是賈洪清。那賈洪清為什么揍徐大寶?下面,我們一起來了解一下。

曾志偉和藍(lán)潔瑛到底是怎么回事 看完你就明白了

曾志偉和藍(lán)潔瑛合作的次數(shù)并不多,因此兩人也沒有什么很大的交集,是很難發(fā)生這種關(guān)系的。而且藍(lán)潔瑛被侵犯一事還不知道是真是假,就算是真的,那也跟曾志偉是沒有關(guān)系的,所以大家在網(wǎng)上吃瓜的時(shí)候還是要認(rèn)清真相,不要被一些假消息給誤導(dǎo)了。

林允穿藍(lán)色套裝小露蠻腰 精致側(cè)顏吸睛

林允在個(gè)人社交平臺上曬出一組春日隨拍,并配文:”用膠片留住春天“。她長發(fā)溫柔披肩,身穿藍(lán)色套裝露出小蠻腰,側(cè)顏精致吸睛。

在春日時(shí)節(jié)邂逅港風(fēng)小花老師

宋佳全新大片,身穿艷麗的印花服飾、復(fù)古的卷發(fā)紅唇… 慵懶隨性或性感嫵媚,帶著狗狗出鏡,在春日時(shí)節(jié)邂逅港風(fēng)小花老師。

當(dāng)紅小花趙露思出席活動(dòng)顏值翻車,雙下巴明顯

95后當(dāng)紅小花趙露思出席某盛典活動(dòng)?,F(xiàn)場現(xiàn)身的趙露思身著印花粉色長裙,高貴典雅。