Tuesday Apr 30, 2013

Kindleなどに適したMobi,ePUBフォーマット電子ブックマニュアルの日付

どういう製品のマニュアルが ePub, mobi 化されてるかは以前書きました

リストが現時点で11個あるようです。そのリストの中のマニュアルのどれが最近アップロードされたか
分かれば便利かなと思いpythonで 'ls -l' のような出力を出すスクリプトを書いてみました。

 

import lxml.html,urllib2,sys;
baseurl = sys.argv[1]
tableAttr = '[@summary="List of all books"]'
opener = urllib2.build_opener()
root=lxml.html.parse(baseurl)
titles = [row.text for row in root.xpath('//table' + tableAttr + '/tr/td[2]')]
mobi = [row.attrib['href'] for row in root.xpath('//table' + tableAttr + '/tr/td[3]/a')]
epub = [row.attrib['href'] for row in root.xpath('//table' + tableAttr + '/tr/td[5]/a')]
for t,m,e in zip(titles, mobi, epub):
  m = opener.open(baseurl[:-14] + m).headers.get("Last-Modified")[5:22]
  e = opener.open(baseurl[:-14] + e).headers.get("Last-Modified")[5:22]
  print "%s,%s\t%s" % (m, e, t.encode('utf-8'))


以下の最近アップされたと思われる製品のマニュアルリストでの実行例です。
上記のコードをコピペで oracleJPebooks.py というファイル名で保存してあるとします。
最初のカラムがmobi,2番目がepubの日付です。ファイルサイズも取ってこれれば便利かもしれませんね。

Oracle Fusion Middleware Identity Management 11g リリース2(11.1.2)

Oracle Fusion Middleware Identity Management 11g リリース2(11.1.2)

 Oracle Fusion Middleware管理者ガイド 11g リリース2 (11.1.2)Mobi / ePUB

$ python oracleJPebooks.py http://docs.oracle.com/cd/E37472_01/ebooklist/ebooklist.html | head -3
23 Apr 2013 18:57,23 Apr 2013 18:57     Oracle Fusion Middleware管理者ガイド 11g リリース2 (11.1.2)
23 Apr 2013 18:57,23 Apr 2013 18:57     Oracle Fusion Middleware Oracle Access Management管理者ガイド 11g リリース2 (11.1.2)
23 Apr 2013 18:57,23 Apr 2013 18:57     Oracle Fusion Middleware Oracle Adaptive Access Manager管理者ガイド 11g リリース2 (11.1.2)




About

The views expressed on this blog are my own and do not necessarily reflect the views of Oracle.

Search

Archives
« April 2013 »
SunMonTueWedThuFriSat
 
1
2
3
4
5
6
7
9
10
11
12
13
14
20
21
23
24
27
28
29
    
       
Today