2010年10月27日 星期三

Seminar Paper Report about Real-time Event Detection


Earthquake Shakes Twitter Users: Real-time Event Detection by Social Sensors
Takeshi Sakaki, Makoto Okazaki, Yutaka Matsuo所提出,發表於 WWW'2010

--

摘要

微網誌(Microblogging)不同於部落格(Blog),使用者一週可能發表3到5篇的部落格文章,但是一天可能就發表3到5篇的微網誌,這是一個即時(Real-time)的環境,每個使用者就像一個裝在社會上的感測器(Social Sensor)一樣,可以隨時回報自己在真實環境感受到的事情,反應當下(Now)的想法,我們可以收集這些感測器所回報的資訊並且加以利用,如何有效利用這些資訊就是值得探討的一項課題。

從以往數據觀察發現,使用者多半會對於大型的社會事件或災難事件進行關注與回報,因此,作者假設微網誌(Microblogging)使用者會即時反應地震或颱風等災難事件,藉由收集感測器回報的資訊之後進行過濾分析,以此基礎建立地震和颱風事件的偵測系統。

Why Detection earthquake and typhoon?
- They are of large scale
(many users experience)
- They particularly influence people’s daily life
(they are induced to tweet about it)
- They have both spatial and temporal regions
(real-time location estimation would be possible)

PS:資訊收集的來源是透過Twitter的API

--

方法與實驗

目標:
1.Provides an example of integration of semantic analysis and real-time nature of Twitter.
2.Earthquake prediction and early warning about innovative social approach .

整個模組(Model)架構分為兩大部分:
事件資訊收集訓練與語意分析。
事件發生時間計算與地點評估。

Training and Analytics

使用SVM分成三個特徵(feature)來進行正確資訊的訓練
(SVM是常用在分類訓練上的方法,是一種有人監督的學習過程)
Features A - (statistical features) 統計事件
Features B - (keyword features) 事件關鍵字
Features C - (word context features) 關鍵字上下文

實際使用earthquake或shake等字眼進行搜尋,可以發現Features A的特徵有較好的準確度,而Features C的準確度較差,或許是因為當重大災難來臨的時候,使用者為了節省時間多半會使用簡短的文字來告知這項訊息。

Temporal and Spatial

假設事件的發生時間是指數分布,可以推導出當事件發生後,過多久時間會產生tweets。

使用Kalman Filters與Particle Filters進行地震震央位置(location)的過濾,實驗結果證明Particle Filters的效果較好,原因來至於地震的中心有可能在海上等無人居住的地方,所以Kalman Filters的效果會較差。

實驗結果證明此方法能比日本氣象廳(JMA)來的更有效率預測到地震事件的發生。

--

討論

If the detection of rainbow information?
When two location occur earthquake in same time?
More advanced algorithms for query expansion?

回饋

如何針對一個問題找到有趣的應用,並且可以實作它?
對於一個新的問題,可以試著去思考假如是自己會如何去解決,在來看看別人作法和自己有什麼不一樣,因為每個人的思維是不一樣的,所以解決的方式也會不一樣。

除了天然災害以外,有可能應用到其他事件嗎?
假如應用到其他事件偵測,那搜尋關鍵字(query keyword)要怎麼得到呢?

當事件發生的頻率提高時,預測是否會降低?
我們有可能掌握使用者習慣嗎?

大膽假設,細心求證
這是做研究需要保持的心態

0 留言:

張貼留言

Related Posts Plugin for WordPress, Blogger...