2007年3月29日 星期四

手機單槍!

坐捷運時常會想些有的沒的。

前幾天想到手機應該要附個雷射筆功能!這樣參加報告時,覺得上面的人投影片哪裡講得有問題,不用遞雷射筆或是用手指在「那邊、那邊」。只要手機拿出來,一指!超帥!

結果發現早就有人做了...... :(

更扯的是今天聽到這個也被做了......

不過在手機上面做單槍,真的有夠帥!

Statistical Machine Translation

http://taiwan.cnet.com/news/software/0,2000064574,20116383,00.htm

看起來概念上就是 googlefight!不懂的東西怎麼辦呢?就吸取過去人類的智慧精華來幫忙!有了大量資料作為背景知識,這的確是個不錯的主意。

當然可能有的問題有相關知識太少(如文中所提)。另外,是否會發生以訛傳訛的情況呢?當大家都認為某件事是對的以後,以後的人也就追隨前人的腳步......於是就沒有翻盤的機會了(不過這剛好是語言演化的情況呢!)。如同用 googlefight 猜測一個成語正確的字該如何寫,而不是上查教育部字典。是要聽信權威,抑或民主投票?

這又讓我想到 wikipedia 也要作 search,然而是利用人類腦袋而非電腦 cpu。不過無論是 wikipedia 或 google,所憑藉的都是人類的智慧遺產。話又說回來,人類本身的學習不也如此?

2007年3月28日 星期三

益智遊戲 AIRPORT TRAFFIC CONTROL

只能佩服這種巧思啊...

http://blog.yam.com/ming010/article/8374000

Upaper

可能是為了不要讓爽報太爽,聯合報系昨天推出了「捷運報」Upaper。本來就沒在捷運上看報的習慣,只是在昨天新開張時拿了一份。嗯......廣告很多,跟爽報一樣沒什麼內容。今天在捷運上瞥到一頁大大的「棒棒堂送U報」OMG! 這讓我忽然很好奇捷運族的年齡層分佈為何,至少一般的上班族應該對棒棒堂還是嘿咻會黑澀會沒什麼興趣吧。

現在才知道爽報是壹週刊系列的。前一陣子才在爽報上到對廣告主的宣傳:他們以臺北車站為中心將捷運路線分成四個區塊,廣告主只需選擇想要的區域來登廣告,負擔就減少了。雖然爽報本身成本可能略為增加(針對四個不同區域作出四種排版),不過對廣告主而言,這樣的方案應該滿吸引人的。爽報 vs. Upaper 誰勝誰負,可能還有很長的路要觀察。

2007年3月26日 星期一

Blogger Hack !

堯@部落格裡的 Blogger Hack 區,教你如何在 blogspot 弄些有的沒的......畢竟預設介面能調的實在不多。

首富傳聲筒VS樂生買廣告

http://editorland.chinatimes.com/ho/archive/2007/03/20/3383.html

在電視新聞全天狂播下,台灣首富不費吹灰之力,他的愛情觀已滲透到家家戶戶;同一時間,樂生療養院的公共政策思辯,卻只能透過部落格募款刊登報紙廣告發聲。對於公共討論與多元價值的全面棄守,無疑已是主流媒體惡性競爭的最大悲哀。

還有更多...

2007年3月21日 星期三

Automatic Ranking by Extended Binary Classification

軒田今天到中研院給了個相當精采的演講!內容是關於如何打分數...

舉個例子,今天我看了一些電影,並在 imdb 上評分 1 到 10。別人要如何從我評過分的電影來推測我的喜好呢?或者更精確一點,能不能猜到我對某部新電影的評分?

這並不是一個單純的 regression 問題,因為評分雖然有大小,但對我來說 10 和 9 的差距並不一定等同於 6 和 5 的差距。也就是 1- 10 的給分制只是一種相對大小,但無法真正的量化。
這也不是一個單純的 multi-class 問題,因為分數之間是有大小關係的。對於一部我可能會評為 5 分的電影,猜測我會評 6 分和猜測會評 10 分,這兩者的錯誤程度是有分的。

對於這種 "ranking" 問題,軒田他們給了一個 scheme,只要你手上有一個 binary classifier 就能套用他們的流程解決問題!大致上的概念是,根據我之前的評分紀錄,去判斷我為什麼會投 1 - 7 分或是 8 - 10 分,由此定出一個 threshold,這是一個 two-class 的問題。定出 9 個 threshold 以後,就有各個分數的區間了。

2007年3月19日 星期一

300 ── 惡搞

嗯...在貼 300 的心得之前,先看一下別人的惡趣味吧 :p

ytmnd 真是好物!

2007年3月18日 星期日

日本表情符號排行榜

http://whatjapanthinks.com/2006/08/14/japans-top-thirty-emoticons/ 列出了日本人最常用的表情符號前三十名。感覺跟台灣用的不大一樣,大部份的臉都是由左右括號組成的。或許哪一天誰也可以做做台灣的吧 :p

2007年3月16日 星期五

Workrave —— 保護你的鍵盤 (?)

Workrave 是一個能記錄你目前按了多少鍵,滑鼠移動了多少距離的一個程式(儼然就是個 keylogger )。每固定一段時間就會提醒使用者「休息的時候到啦!否則你的手會爛掉啦!」之類的。

基本上我裝 workrave 但將提醒休息功能關掉。我只是純粹好奇一天工作下來到底會敲多少鍵,目的並不在保護我的手腕 :p 結果昨天好不容易將 workrave 編起來已經十點多了,下班前竟然統計出 24K 的 keystroke! 天啊比我想像的還多……看來應該要好好保護我的鍵盤了

2007年3月14日 星期三

觀察部份情況

目前與一些作 alignment 的人共事(對二類組的我真是一項考驗),他們想要將一堆東西和另一堆東西 match 看看。重點是,今天聽到了不錯的思考方式:

我們能夠作到 match 一個物種裡全部的東西,不過我們可以觀察當 match 這個物種的某一部份、一個 strain 時的結果。也許前者並沒有什麼特殊之處,不過後者會有


當然要小心的是 overfitting,以及為了某種期望的結果而去作相對應的實驗,導致這些贊同性結果的出現只是某種同樣的 realization

2007年3月13日 星期二

2007年3月12日 星期一

利用 SSH tunnel 連 VNC

http://twntwn.info/blog/ajer001/archives/1617
http://pigtail.net/LRP/vnc/

client (viewer) 是 M$ Windows的情況下,可以用 putty 建一個 ssh tunnel。將自己 localhost 的某個 port 和 server (server) 的 vncserver port (5901例如) 連繫起來。這樣在 viewer 連線時,只要連到 localhost 的那個 port 即可──不用怕被奇怪防火牆擋起來啦 :)

不過這樣作的缺點是自己這邊會多一窗 putty......。似乎有另一個方式是在 server 那動手腳,可以藉由某台機器作為跳板。

(後記:補個 link: http://cha.homeip.net/blog/archives/2006/01/putty_ssh_tunne.html