這篇是參加AI Forum 2012的筆記,紀錄一些重點作為以後的參考。
會場照片
--
Think part
解決問題的思維可以有兩種:
top→down
bottom→up
面對資料時的處理方法與想法:
1. Feature Engineering
2. Blending and Ensemble
3. Validation
4. Training and Optimization
5. Novel ideas
重要的點:
Feature(特徵的擷取、分析與排除)
Scaling(特徵的正規化與一致性)
Combination(方法的挑選與組合)
Diversity(注意結果的多樣性)
"art rather than science"
--
Model part
Probability model
Vector space model
字詞無法用機率模型或是向量空間模式完整的描述
真實世界(real world)不是如此簡單(simple)
自然語言需要新的模型,改變training和testing的模式
Relationship model
可行嗎?
pure data?
not instant data
it should lone-time data(historical + real time)
--
Future part
低頭族(mobile user)
在未來會是新興的族群,也就會產生新的消費模式和對象
Content + Service + Device
ITU(物聯網)
how to use "cloud computing power"?
how to do "meta data large scale processing"?
mine information from different sources.
big data analysis(3v's)
--
Data mining part
網路ADS應該要有的新概念,
ADS不應該一直存在,而是當使用者對結果不夠好的時候才產生廣告。
(雪中送炭>錦上添花)
Reference Recommendation
http://refseer.ist.psu.edu/
Dr. Jian Pei's Selected Publication
http://www.cs.sfu.ca/~jpei/publications.html
--
Recommender system part
anything are component.
點推薦的時代→線推薦的時代
(點推薦以item為主,線推薦除了item以外,還加入時間和空間的因素)
會後與老師合照
0 留言:
張貼留言