国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術(shù)文章
文章詳情頁

MySQL Flink實時流處理的核心技術(shù)之窗口機(jī)制

瀏覽:148日期:2023-05-08 10:17:43
目錄
  • 1.為什么要學(xué)窗口
  • 2.Flink中的窗口
  • 3.滾動窗口(Tumble)
    • 3.1 概念
    • 3.2 案例SQL

1.為什么要學(xué)窗口

流式計算,一般有兩種場景:

  • 無限制的流式計算,比如:wordcount案例,它沒有任何外部的限制條件,這種情況不多。
  • 有限制的流式計算,比如:統(tǒng)計早高峰時間內(nèi)經(jīng)過某個道路的車輛數(shù)。

對于第二種情況來說,我們需要加上額外的限制條件。最常用的限制條件就是時間了。

這個時間段,在程序中,就用一個窗口來表示。

也就是說,窗口的作用:把流式計算轉(zhuǎn)換為批量計算,窗口是流轉(zhuǎn)批的一個橋梁。

這就是為什么要學(xué)窗口的原因了。

2.Flink中的窗口

在Flink中,窗口可以分為如下幾類:

  • 滾動窗口(Tumble)
  • 滑動窗口(hop、Slice)
  • 會話窗口(session)
  • 漸進(jìn)式窗口(cumulate)
  • 聚合窗口(over)

3.滾動窗口(Tumble)

3.1 概念

滾動窗口 :窗口大小 = 滾動距離(時間間隔)

特點:上一個窗口的結(jié)束就是下一個窗口的開始,數(shù)據(jù)不重復(fù)、也不丟失。

3.2 案例SQL

#1.創(chuàng)建source表
CREATE TABLE source_table ( 
 user_id STRING, 
 price BIGINT,
 `timestamp` bigint,
 row_time AS TO_TIMESTAMP(FROM_UNIXTIME(`timestamp`)),
 watermark for row_time as row_time - interval "0" second
) WITH (
  "connector" = "socket",
  "hostname" = "node1",
  "port" = "9999",
  "format" = "csv"
);
#2.語法
tumble(事件時間列,窗口大小)
窗口大小是用戶自定義的。比如30分鐘、1小時等。
直接把tumble窗口放在group by語句后即可。
比如:tumble(row_time,interval "5" second)
含義:定義一個5秒大小的滾動窗口。
#3.數(shù)據(jù)處理
select 
user_id,
count(*) as pv,
    sum(price) as sum_price,
UNIX_TIMESTAMP(CAST(tumble_start(row_time, interval "5" second) AS STRING)) * 1000  as window_start,
UNIX_TIMESTAMP(CAST(tumble_end(row_time, interval "5" second) AS STRING)) * 1000  as window_end
from source_table
group by
    user_id,
    tumble(row_time, interval "5" second);

到此這篇關(guān)于MySQL Flink實時流處理的核心技術(shù)之窗口機(jī)制的文章就介紹到這了,更多相關(guān)MySQL Flink窗口機(jī)制內(nèi)容請搜索以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持!

標(biāo)簽: MySQL
主站蜘蛛池模板: 和平县| 嘉义县| 固原市| 隆安县| 阿瓦提县| 禄丰县| 辉南县| 个旧市| 五峰| 始兴县| 图们市| 吐鲁番市| 德钦县| 荃湾区| 江源县| 洛川县| 延川县| 广水市| 南漳县| 海丰县| 炎陵县| 连云港市| 红河县| 科技| 遂川县| 隆化县| 铁力市| 大厂| 汝南县| 德保县| 广灵县| 浦江县| 霸州市| 兴化市| 张家口市| 平塘县| 梁河县| 三江| 新野县| 齐齐哈尔市| 周口市|