跳到主要內容

發表文章

目前顯示的是 5月, 2015的文章

抓抓爬爬的好幫手 PHP CURL

好一個抓爬仔 PHP cURL 現在好流行 “自己的 OO 自己 O” 前次的會議中,看到傳播學院的學生實實在在的貫徹了這個理論,“自己的 網頁 自己 爬 ”該學生由於不想一頁一頁的存需要的網頁,自己寫了一個小爬蟲來爬這些網頁的資料存成 CSV 檔。只能在心裡說:同學,留口飯給我們吃啦! 對於爬資料,PHP 裡面除了使用 fopen 的方式抓取網頁,還有一個厲害的抓爬仔函式庫 cURL (client URL) 。這個函式庫支援 libcurl,允許我們使用來與不同類型的 Server 做溝通。在 ubuntu 下預設是沒有安裝這個套件,可透過 apt-get 來安裝。 $ sudo apt -get install php5 -curl cURL 函式 使用 PHP cURL 的方法很簡單,只要初始化、設定、執行、關閉四個步驟就好,活用和複雜的部分是在 設定 這個步驟裡的參數設定。 初始化 curl_init() 函式初始化一個 cURL session,會傳回一個 cURL handle 作為後面設定執行等函式使用。初始化的時候可以直接指定 URL ,或保留空白由後面設定中在指定。 設定 使用 curl_setopt() 函式設定 cURL session handle 的項目內容,這裡有非常非常多的項目參數可以設定,可以參考 官方網站 curl_setopt 的項目參數說明本文後面僅列出常用的參數。 執行 curl_exec() 函式執行一個已經設定好參數的 cURL session。執行成功時會回傳 TRUE 失敗時回傳 FALSE ,如果參數裡包含 CURLOPT_RETURNTRANSFER 設定為 TRUE 時,執行成功後會回傳內容。 關閉 curl_close() 函式會關閉指定的 cURL session,並釋放資源及刪除 cURL handle。 一個簡單的範例: // 建立一個新的 cURL session $ch = curl_init(); // 設置 URL 及其他參數 curl_setopt( $ch , CURLOPT_URL, "http://www.example.com/" ); curl_setopt( $ch , CURLOPT

使用 Stackedit 發佈至 Blogger

使用 StackEdit 發佈至 Blogger 目前部落格裡新的文章幾乎都是在 StackEdit 上使用 Markdown 來完成撰寫,是一個舒適的撰寫體驗,也更能讓自己專注在文章的撰寫,不用去調整版面上的細節。StackEdit 除了可以將文本直接存在 Google Drive 上,圖形直接嵌入引用 Google+ 相簿,讓整個寫作的流程都是在雲端上完成,另外一個我喜歡的優點,是能夠直接將寫好的文章發佈到自己的部落格上。 發佈至 Blogger 部落格 將文章發佈至 Blogger 上的方法非常簡單,在 StackEdit 的左上角開啓左邊的功能列,拉開 Publish 項目並點選 Blogger,如下圖: 第一次使用時會導引至 Google 的授權頁,回到彈出的對話視窗,填寫好 Blogger 的 URL 內容。新發佈不用填寫 POST ID,這個是未來若需要更新內容的時候使用的。 按下「OK」後就完成發佈的動作,發佈完成後,在 StackEdit 該篇文章的右上角會出現 Blogger 的 Icon。 部落格的樣本改造 文章發佈至 Blogger 後有的模板會有小小的問題,如果我們使用 Markdown 時沒有寫入圖片的最大寬度,插入的圖片若比較大就會造成圖形突破樣板的驚嚇感。 這個可以透過自己改造Blogger 模板內容的 CSS,將圖片最大限制在某個數值。簡單一點的方式,是選擇現在 Blogger 中就已經有限制圖片大小的佈景主題。 程式碼高亮標識 StackEdit 的程式區塊是有支援程式碼高亮標識(Highlight)的功能,預設是使用 Highlight.js 的函式庫,也可以使用 Google prettify。Highlight.js 目前已經支援 118 種的程式語法自動偵測。還有 54 種的 Style 可以選擇。但是發佈至 Blogger 後因模板沒有相關的引入,所以程式碼區塊就和一般的文字一樣,沒有區塊和程式碼標識的區別。 我們可以透過修改 Blogger 的樣板的樣式,引入 Highlight.js 的函式庫與樣式。進入 Blogger 的後臺管理頁面,在左方的選單中選擇 範本 ,然後右方選 編輯 HTML ,開啓樣板的 HTML 編輯畫面。 我們可以在 Highlight.js

Markdown寫作部落格

使用 Markdown 寫部落格 年紀大了,很多最近在查詢的資訊其實以前都花一番功夫查過,沒有記錄下來都還要再花時間找回。之前大部分的做法有二,一個是直接寫部落格,二來是使用 Evernote。 編輯的時間太長 部落格一直以來都是使用 Google 的 blogger ,內建的編輯器有點時代久遠,編輯與調整使得,每次都要花很久的時間才能完成一篇文章的撰寫。於是開始工作後,部落格就由週記、月記….間隔一直慢慢的拉大。在未發佈的文章裡放了滿滿的參考連結。 編輯器太過陽春 Evernote 是今年很多人推廣的一個筆記軟體,功能一直的加強擴張。有了 Windows 及 MaxOS 的應用程式,卻沒有 Linux 可以使用的應用程式。身爲 Linux 的使用者,只能使用 Evernote 的網頁版,而網頁版的編輯器功能大概就只是比 Notepad 強一些而已。 筆記也能分享 既然花了這麼多的時間查詢資料、整理資訊,總是希望這樣的結果是可以與人分享的,知識是需要交流才能夠更進步。放在 Evernote 就比較難與很多人分享與流通。 基於上述的理由,決定探訪最近很多 Hacker 使用的 Logdown 。Logdown 也是一個部落格平臺,最大不一樣的地方是使用 Markdown (Markdown 是一個專門爲了網路寫作而設計,能夠將文字轉換成 HTML 標記的語言。)來編輯,Logdown 結合 Blog 與 Markdown 成了平臺的名稱。 Markdown 是個很酷的東西,幾乎使用鍵盤就可以完成一篇文章,不需要頻繁的使用滑鼠。可是…可是…這麼多年的累積心裡希望的還是不要更動太大(大搬家),如果能一次滿足兩個願望就好了! 找了一些編輯器,看到網路有推薦一套 Markdown 的編輯器 StackEdit ,是一款和 Google Chrome 整合的 Web Application,可以在 Chrome 的 web store 上找到這個 StackEdit 應用程式。選擇使用 StackEdit 的原因有幾個: 跨平臺使用,有瀏覽器就能編輯 使用 Chrome 瀏覽器作爲應用程式載體,所以只要是能夠使用 Chrome 瀏覽器的桌面環境都可以使用,除了 Windows、MacOS、Linux(Fedora,Linux Mint,uB

Atom 的中文顯示框框問題

Atom Editor 中文顯示框框問題 去年(2014)2月的時候,GitHub 推出一個長相很像 Sublime text 編輯器的文字編輯器 Atom ,是一個以網頁為基礎開發的編輯器,目標是希望從小學生到駭客都會使用的好上手編輯器。結合了 sublime text 與 Emac 的優點,經過六年的開發磨了一把好劍,去年 5 月的時候 GitHub 將核心程式與套件管理程式開源 修改 style 檔案 開啓家目錄下 .atom 裡的設定 less 檔 ~/.atom/styles.less ,在將核心程式與套件管理程式開源。 因爲是基於 Chromium 的桌面程式框架和 Coffeescript 所寫,所以能夠跨平臺使用整合使用體驗,也可以使用我們熟悉的 HTML、CSS、Javascript 來修改一些 Atom 的內容。有機會將瀏覽器使用的 WebGL 或是視覺化常用的 Javascript 函式庫 D3.js 使用在 Atom 上。 因為使用了 Node.js 的架構,所以可以使用 Node.js 裡 npm 管理的套件(六萬多個)。Atom 有許多優點也有一些小缺點,現在還在積極的發展中,版本更新的速度很快相信許多問題能迅速的獲得解決。 Atom 中文顯示變框框 Atom 在 Linux 的版本中中文顯示會變成一個個的框框,這多半是因為預設使用了沒有支援中文的字型所造成,可以由 setting 裡的 font-family 設定自己喜歡有支援中文的字型。 Atom 因為是由 GitHub 開發所以有支援 markdown 的語法,剛好最近開始練習使用 markdown 語法,剛好在離線時可以拿來在本機使用。但是開啟 maekdown preview ( ctrl+m )的時候,即使在 setting 中有設定 font-family 中文還是會變成框框字,如下圖。 修改 style 檔案更換字型 如前述,由於 Atom 是用 chromium 的桌面程式框架,所以可以使用 CSS 來定義(大心 )。修改方法是,開啓家目錄下 .atom 裡的設定 less 檔 ~/.atom/styles.less ,在前面先定義 font-family 字型,套用在 atom-text-editor 和 markdown-prev