X

Katsumi's Blog

Data Types

2県以上にまたがる郵便番号を求めるSQL。郵便番号JSON、その5

今回はストリーミング的にOracle DBにロードした郵便番号データの中から複数県にまたがるものを問い合わせるSELECT文の紹介です。郵便番号や市区町村データを取り扱うときにはまったこと - Qiita市区町村はおろか県を飛び越えて同じ郵便番号を持ちうるケースがあるQiitaで書いてあるように3件返ってきました。全部で...

今回はストリーミング的にOracle DBにロードした郵便番号データの中から複数県にまたがるものを問い合わせるSELECT文の紹介です。郵便番号や市区町村データを取り扱うときにはまったこと - Qiita市区町村はおろか県を飛び越えて同じ郵便番号を持ちうるケースがあるQiitaで書いてあるように3件返ってきました。全部で119777の郵便番号がありますが2秒かかってないですね。SQL> set timing onSQL> l1 select count(t.pref),code2 from3 api_responses,4 json_table(response,5 '$' columns (6 code varchar path '$.code',7 nested path '$.data[*]'8 columns (9 pref varchar path '$.prefcode'10 )11 )12 ) t13 group by code14* having count(unique(t.pref))>1SQL> /COUNT(T.PREF)...

ビットを数えるPL/SQL関数

以前数値変数の立っているビットを数える処理について書きました。その際、PL/SQL の実装が実質1種類しか見つからなかったと書きましたが実はもう1つあるのを見つけました。まずはアルゴリズムの種類のまとめサイトから。Bit Twiddling HacksCounting bits set, Brian...

以前数値変数の立っているビットを数える処理について書きました。その際、PL/SQL の実装が実質1種類しか見つからなかったと書きましたが実はもう1つあるのを見つけました。まずはアルゴリズムの種類のまとめサイトから。Bit Twiddling HacksCounting bits set, Brian Kernighan's way前回このブログで書いたHAKMEMと呼ばれているアルゴリズムも出ていますね。そしてKernighanの方を実装したPL/SQLは以下です。中ほどの5行ぐらいがその実装です。その他の部分は複数の値のビット数を合計するメンバー関数などですね。Oracle DBのデータ・カートリッジの実装の例としても面白いと思います。Bitcount aggregate function – radino's blogval := bitand(val, val-1); 

弊社カフェでのConnpass勉強会、グラフ分析

昨日に引き続き、Connpassネタです。Javascript つながりでもあるかもしれません。Oracleの青山オフィスのカフェで勉強会が開催されます。初めての方も歓迎です。PGX ユーザー勉強会 #1 - connpassOracle Labs PGX(Parallel...

昨日に引き続き、Connpassネタです。Javascript つながりでもあるかもしれません。Oracleの青山オフィスのカフェで勉強会が開催されます。初めての方も歓迎です。PGX ユーザー勉強会 #1 - connpassOracle Labs PGX(Parallel Graph Analytics)はグラフに対するクエリや分析のためのフレームワークですカフェは10月にオープンしたばかりでここで社外向け技術系のハンズオンが開催されるのは初めてなのではないかと思います。 2ちゃんねるで揶揄されていたので知りましたがZDNetでもカフェが紹介されています。ダウンロードは以下から可能です。Windowsでは現時点では動きません。Windows担当の私としては悔しいので理由を少し調べたところネイティブライブラリーが多数含まれているのが分かりました。高速化のためだと思います。Oracle Labs PGX: Parallel Graph Analytics Downloadsruns on Linux or Mac OS X 

ドコモさん子会社提供の自然言語処理APIサービス

NTTドコモ様子会社が開発されたテキスト分析APIについて社内セミナーで知りました。Text Analytics API | Data NinjaData Ninja API analyzes text and detects relevant categories, concepts, entities, and...

NTTドコモ様子会社が開発されたテキスト分析APIについて社内セミナーで知りました。Text Analytics API | Data NinjaData Ninja API analyzes text and detects relevant categories, concepts, entities, and sentiments.一般的にこの手の処理はNLP(Natural Language Processing)と略される場合も多いと思います。キーを取得して試してみました。ブラウザーでまず試してみると curl コマンドラインで実行する場合の引数など全て表示されました。 curl だとPOST内容をローカルファイルから読めるので楽だということがわかったので試してみます。まずテストデータは英語のブログからblog4.txtファイルにコピペしました。$ head -3 blog4.txt Probably to most NetBeans users, the need to double-click a file to open it...