本日若干突破口が見えたので書きますかね。 さて、前回は動画を切り抜いてテキストボックスだけの画像を保存することができました。これをテキストデータにしたいと思います。画像から文字を認識してテキストに変換する技術はOCR (Optical character recognition) と呼ばれるやつですね。pythonの場合はTesseractというソフトをpyocrモジュールから使うのが普通みたいですね。 このTesseract(てっせらくと)が厄介でバージョンによってやれることが全然違います。 v3.0x系はjTessBoxEditorというソフトを組み合わせてフォントを使った学習ができます。フォントがインストールされていれば(全ユーザーに対するインストールが必要)画像作るところから学習データを作るところまでやってくれます。認識する画像にゴミを加えることもできる。 ちなみにメギドのフォントはスキップEらしいのでLETSを契約していれば使うことができます(https://lets-site.jp/)。学生のうちに入っておけということです。 アイドリッシュセブンのフォントはアプリ内にクレジットされているようにニタラゴルイカなのでなんとBOOTHで買うことができます(https://typelabo.booth.pm/)。ウェイトはわからんが等幅04辺りではないか。ニタラゴルイカ、全然意識してなかったけどゲーム頻出フォントなんですねぇ(https://note.com/tsugumiarai/n/ndc0a9cf10a86)。 で、スキップEはほとんど上手く認識できたのですが何故かニタラゴルイカの認識が全然上手くいかず……。文字の種類が少なければ学習の回数を増やして精度を上げられるみたいだが、日本語だとそういう訳にもいかないし……。そう思うとアルファベットに対して漢字を含む日本語はOCRにおいて圧倒的なハンデ不利があるな……まぁ中国語に比べたらマシか……。 Tシャツに英語を書いてばっかの国みたいな話がありますが、日本語フォントがスタイリッシュになれないのはひらがなカタカナ漢字という全然形状の違う文字を含んでいる時点でもう全然まったくどうしようもないんだよな。勝てっこないのよ、アルファベットとか、アラビア語とか、あぁいう文字にさ。日本語のことは好きだが表記体系は好きじゃねぇ……。ちなみにTesseractの学習済みデータも日本語データには標準でアルファベットが入ってくる。入れないとまともに文章を識別できないもんな。すいませんね、お手数おかけしてね……。 話が逸れた。 それでニタラゴルイカが識別できなくてふてくされていたのですが一つ上のバージョンがあることを思い出しました。これが昨日。 v4.x系は安定バージョンの中では最新で、LSTMを使ったエンジンを搭載しています。響きがかっこいいですね。 LSTM (Long short-term memory) は自然言語処理モデルの一種で……私の理解するところで喋るとRNNの発展版で今まで入力された単語を適宜覚え適宜忘れながらも次にくる単語を予想するモデルです……。三ヶ月の付け焼き刃だからあまり突っ込まないでくれ。 要するにv3では文字を認識して一文字一文字テキストを認識していたのに対して、v4では読み取ったそれらをある程度固まった文章として認識して、自然な文章になるかどうかで文字認識の結果を調整……ということをしているんでしょう……おそらく……。 ただ問題はv4系ではフォントを使った学習ができないという点です。いや、正確にはあれ、Linux?あれを使えばできるっぽいんですけど、私はあれ系が全然できないのでできません。ターミナル、怖いよね。コントロールCが効かない時点でだいぶ怖い。 フォントのデータがあるんだから学習した方が精度いいに決まってると思っていたが盲点でしたね。フォントがせっかく手元にあったしね。使いたかったんだよね。わかるよ。 そういう訳でv4.1で試したら簡単でした。ニタラゴルイカの方はもう少し整形が必要そうなので(動画中でフェードアウトされたりするとフレーム抽出が厳しい)引き続きスキップEでいきましょう。 #モジュール呼び出し from PIL import Image from IPython.display import display_png import pyocr import pyocr.builders import pprint #OCR
Read More
Category: ブログ
4コマ漫画を描くぞ
創作の話しよっかな。 さっき上げた4コマ漫画。 https://twitter.com/osmnkih/status/1271793355396009985/photo/1 元ネタツイ。 すっぱいコーヒー @osmnkih 6月10日 冗談のつもりで「役作りで髪切ることになったよ」って言ったらショックを受けて「切った髪貰ってもいい……?大事にするから……」などと口走るモモ この時点では漫画にできると思ってなかったけど、(「切った髪の毛を貰う」っていうテンプレート的ヤンデレ仕草にもいろんな感情があるけどモモの場合は「グッズ」みたいなもんだよな……。なんなら出会った頃から伸ばしてるから「思い出のグッズ」だな……。年輪みたいに髪に思い出が詰まっているのかもしれん……。その場合ユキはあんまり引かないだろうからヤンデレ台詞と状況の落差が面白いな……。)まで考えたら4コマ漫画にできる気がしてきた。 【1コマ目】 「切ることになったよ」より、切り終わった後の会話にした方がショックがでかくていいな。髪の長さも「思い出のグッズ」を連想させる会ったばかりの頃の長さの方がいい。でもユキが髪短いと一瞬いつの時代の話かわかりにくくなっちゃうな……。この前同居時代の4コマ描いたし……。あっ背景におかりん置いて事務所の会話にすればいいか。最後モモもユキもボケっぱなしになって終わりそうだったけど、おかりん出せばツッコミが入るしな。いいぞ。これはRe:vale4コマ頻出テクニックなので覚えておいた方がいい。他、大神万理、九条天などでも同等の効果が見込める。 髪切った直後じゃないと「貰っていい?」が現実的じゃなくなっちゃうな。「さっき」って言わせとくか。テンポ崩れそうだし描き文字で。 【2コマ目】 「大事にするから……」の「そういう問題じゃねぇよ!」感が気に入ってるけどそこまでツッコミを入れるのは野暮か……。スタンダードでいいや。 なんか毎回こういう表情のモモ描いてる気がする。上手に描けるようになってきたかも。描き文字は台詞メモの中に一緒に突っ込んでおくと描く時忘れなくて便利だよ。 【3コマ目】 髪を中心に持ってきて顔も隠したくないから構図はこれ一択。あ~これ年輪ちょっと浮いてない!?ここにもおかりんのツッコミ欲しいんだけど……そうするとモモとおかりんの会話が漫画の中心になっちゃうな……。2コマ目、4コマ目のツッコミは削れないからおかりんはここには出せない……。例えがなくても通じるかなぁ……でも木もう描いちゃったしな……。うーん、さらっとモモの台詞として書いてツッコミは読者に任せるか……。補助として(?)入れとこっかな……。モモの台詞だとすると年輪って単語は出てこないな。えーと、切り株?開くか?きりかぶ? 【4コマ目】 「いじらしいじゃないか^^」系でもよかったが素直に喜んでた方が落差があっていいな。おかりんのポーズ1コマ目と被っちゃった。まぁいいか。Re:valeの戯れを前に微動だにしてないという表現になるし。 ウィッグであることには突っ込まないのがおかりんスタイル。今書きながら気がついたけど、年輪だとしても思い出が詰まっているのは頭頂部の髪であるべきだよな。まぁツッコミにしては難解すぎるからどうせ不採用だしいいか……。 【5コマ目】 この4コマの脇のやつという概念が好きなんだけど大抵全部描き終わった後に付け足すから結構面倒でサボりたくなる。サボると意図のわからない空白地帯が生まれてしまうよ……。 こんな感じでネームを描いてあとは線を引いてバケツで色を塗る。ここに関して今述べることは特にない。最近3Dモデルを導入して複雑な構図を描くのがちょっと楽しくなりました。 できた! https://twitter.com/osmnkih/status/1271793355396009985/photo/1 4コマ漫画は4コマという縛りの中で一つネタを成立させるというルールがあるので、そういうゲームとしてはなかなか面白いと思っている。 このツイートも読んでほしい。 すっぱいコーヒー @osmnkih 6月10日 脱皮殻で抜いてるとこ見られて本体に尻尾の裏の鱗が柔らかいから使っていいですよって言われたホプ!?
ソシャゲのシナリオをテキストデータに変換する(フレーム抽出編)
ある日元気にソシャゲのオタクがはまったばっかりの時に作るメモを書いていました。 段々苛立ってきた。令和にもなってテキストを探すためになんでこんなことをやっているんだ?ロード時間、必死に記憶をたどってあちこちの章をうろうろする時間、話の冒頭だけチェックして→やっぱ違ったかも→いややっぱこの話の最後の方だわってやる時間。あ~全部無駄。 紙の本ってすごいな。テキストを大雑把に検索する方法って未だに紙の本が一番早い。シナリオ本が欲しい。次点でシナリオ検索ボックス。両方あるともっといい。ソーシャルゲームとしてのシナリオへの誠意……(「誠意」という言葉を私は世間で言う「愛情」のように容易に使いがちで宜しくないと思いますがここでいうシナリオへの誠意とはゲーム内でシナリオという要素が結局顧客の愛着、課金につながっていることを自覚した開発コストをかけろという要求を示しています)。しかし私は極めて理性的な人間なのでわかります。シナリオはゲームを起動させるためのインセンティブを担っているわけですよね。それからゲームのブランドとしてシナリオ本を出すためのコストも考慮しなければいけない。俺達は直打ちのtxtファイルでいいと言っても公式がそんなもの出すわけにはいかないんだ(でも突然WAVファイルを配布するゲームならワンチャンあるかもな)。 世は大自己責任時代。ソシャゲのユーザーも楽しみ方は自らで見いださなければならないとされる。 うーん、じゃあ自分でやるか。 オートモードで録画するとシナリオが動画として保存できるから、ここからテキストが抽出できればそれでいいだろう。本当は録画さえ面倒くさいがそこはもうどうしようもないので妥協しましょう。しかしシナリオのオート機能って到底人が読めない速さで流れていくけど、なんのための機能なんだろうね。もしかして公式としてテキスト抽出を推奨しているのかな?(自己の正当化) #動画の切り出し import cv2 import matplotlib.pyplot as plt import numpy as np import time import winsound def mov_info(cap): print(“フレームレート(枚数/second)”, cap.get(cv2.CAP_PROP_FPS)) print(“フレーム枚数(枚数/second)”, cap.get(cv2.CAP_PROP_FRAME_COUNT)) print(“秒数”, cap.get(cv2.CAP_PROP_FRAME_COUNT)/cap.get(cv2.CAP_PROP_FPS)) (出力) フレームレート(枚数/second) 29.74832623603263 フレーム枚数(枚数/second) 12819.0
Read More
春に買って嬉しかったもの
最近買って嬉しかったもの(買ってよかったものは君が君の金で買ってから君の価値観で決めるんだ)の話をします。 ・乾燥機付き洗濯機 https://jp.sharp/sentaku/products/ess7d.html これまで住んできた家が共用洗濯機つきの家だったので初めての購入だったが、奮発した。 洗濯という家事は様々な観点から本当に最悪だったから。 1. そもそもゴミが取れない 洗濯機が古かったとか洗濯物を入れすぎとかそういう事情もありそうだが、フリース生地の服が洗濯機内でゴミを吸着しまくり、洗濯が終わった後にそれをコロコロで取るという作業が発生して最悪。フリース以外もはたくとホコリ出るし。なんでよ。洗っているにも関わらずゴミがついているので、油汚れ等についても本当に落ちているか疑念が生じてくるのが最悪。 ニューで高等な洗濯機になってゴミが取れるようになった。洗濯パートと乾燥パートで2箇所ゴミ受けがあるのだが、洗う度にそこのホコリを掃除するのが楽しい。取れておるわい、と思うので。 2. 干す際の整形は無価値 これは私が言うまでもなく全人類が気がついていることと思うが干して畳むという作業は完全に無駄。 着る(服の形)→洗濯(無秩序な形)→干す(服の形)→畳む(収納に相応しい形)→着る(服の形)のうち、干している部分の整形作業は何の意味もない。耐えられんよこんなことは。 このうちどこかを省略するとしたら論理的に考えて選択肢は「服の形のままクローゼットに収納」か「干す作業をスキップする」しかない訳だから。でも論理的に考えると最も相応しいあり方は洗濯機がでかい部屋みたいになって「干した形のまま洗濯から収納まで一つの部屋で終わる」ことだ。そういう技術が開発された暁にはいち早く言及した貢献を評価して私が利用できるようにして欲しい。 3. 干すのが面倒 外は暑いし寒い。雨の様子とか気にしなきゃいけないのも嫌。そういうのは山にいる時だけで十分。 私は服に何も、全く、一切の興味がないのだが、興味がないからこそ服に関心を払いたくない。触っていたくもない。だからお金を払って手間をスキップする。よかったよかった。 ・食洗機 https://panasonic.jp/dish/p-db/NP-TCM4.html ドラム式洗濯機に続き所謂現代の三種の神器。これが欲しくて引っ越しの時に広い台所を条件にしたくらいだ。食器を洗うという作業はマジで最悪だから。 そもそも飯を作るという偉業を達成しているのに何故その上で更に働かなくてはならない?飯を作る作業はいいよ。創作だし。生産的だし。片付けは嫌でしょ。労働だよ。なんで飯を作るという褒められるべき作業をしたというのにその結果労働が発生するのか。作業が発生するタイミングも嫌。食事した後に働きたくない。 その癖洗わないと飯を作る作業が滞る。食器は無限ではないので。逆に言うと食洗機を導入して飯を作るハードルが下がった。最高。あとでスーパー行こ。たらこパスタ作りたい。 あとこれが全部と言えば全部だが、手が荒れる。皮膚弱いのに。洗濯物も手が荒れるから触りたくなかったところがある。これで残す濡れ家事は風呂掃除だけだ。あれも擦らずに済むスプレーが最近はあるらしい……。 食洗機、聞いてはいたがやや癖がある。どうしても場所を取るし、このサイズだと調理器具が入らなかったりする。あと食器の詰め方に工夫がいるとか(絶対に洗えてないだろって箇所が洗えていたりして謎)。でも、もうそういう癖も含めて君と付き合っていくって決めたよ……一生……。嘘じゃない、見てくれ、君のためにハンドルが取れる鍋だって買ったんだ……。 ・コーヒーメーカー https://www.delonghi.co.jp/products/detail/id/445 コーヒーを抽出する作業は前2つに比べるとそこまで最悪ではない。でもコーヒーを抽出している時間は台所に立ってティファールを持って完全に「コーヒーを抽出する」という作業にかかりきりになる。何様なんだ。たかが飲み物の分際で強気に出たな。毎日飲まれるからってつけあがるな。 今は粉を用意しているけど豆からでもいいなと思っている。ミルで惹く作業はつけあがってもよい。楽しそうだから。 コーヒーの味って正直そこまでわからないけどアロマ機能で淹れるとおいしい。赤いし小さくてかわいい。満足。 ・サボテン https://www.google.com/search?q=%E7%99%BD%E7%BF%81%E7%8E%89 なんかやたら花がつく。見てると元気になる。
読書メーターからブクログに読了本のデータを移行する
5年位前から読書メーターで読みたい本と読み終わった本と感想の管理をしていたのだが、だんだん非公開にできないのが不満になってきた。これは読書メーターが読書好きが集まるSNS(率直にいってXXXXXだ)を標榜しており5年前の私がそれに気が付かなかったから仕方がないことなのだが、読む本もそこに書く感想も割と赤裸々なものがあり、一切非公開にできないのは、ちょっと。 思想の自由を守れ。 耐えきれなくなったので1年前にブクログに移行した。その際、読みたい本一覧についてはどうしようもないので選別も兼ねて手動でデータを移行した。これは読書メーターがXXXXXなサービスでインポートサービスがあるにも関わらずエクスポートサービスがないから。ちなみにブクログはどちらもある。 150冊くらいデータがある読了本(シリーズは最初の一冊しか登録してなかったり職の本を端折ったりしているから実際は多分5年でもうちょい読んでますよ:読書する人間的自意識主張)に関しては、流石に手作業で移行するのは面倒でそのまま置いておいた。スクレイピングとやらができれば抽出できると知ったけど、Rのその辺りはよくわからなかったので諦めた。1年前の私に解説すると、スクレイピングとはそのパソコンに命令して君の代わりにネット上の情報収集をやらせることでありこれをすると例えば昔書いたスコアアタックモデルのデータ入力パートが省略できるようになったりするよ。 そういう状況だったのだが春に転職してあれがそっち系になったので、pythonの練習をかねてコードを書いた。これでXXXXXサービスとはおさらば。ヨッシャッ! まず読書メーターのどのページから情報を拾ってくるか決める。一年程前に書かれた記事によると、当時は読んだ本まとめみたいなコードが生成できたらしいのだが、読書メーターの仕様変更で一切できなくなっていた。すごいな。こんなに早く一方的に情報が無価値になることがあるのか。 ログインしたあとの読書管理ページのリストから拾うことにした。これは若干失敗で、読了本とそれ以外(未読本とか)のページの書式が違ったので、読了本にしか使えないコードになっちゃった。まぁいっか……。 #ログイン from selenium import webdriver from selenium.webdriver.chrome.options import Options from lxml import html import time chrome_options = webdriver.ChromeOptions() driver = webdriver.Chrome(options=chrome_options) driver.get(“https://bookmeter.com/login”) # ID/PASSを入力 id = driver.find_element_by_id(“session_email_address”) id.send_keys(“YYYYY”) password = driver.find_element_by_id(“session_password”) password.send_keys(“ZZZZZ”) time.sleep(1)
Read More