Author Archives: daisuke

watched’響け!ユーフォニアム’ 1st,2nd season

全国を目指す吹奏楽部の話(公式HP)。自分が進みたい道の途中で壁にぶつかったとき、色々なことに折り合いをつけて諦めちゃう人もいるし、自分の信じた道を突っ走る人もいる。「どちらの決断が正しいか」ではなく、決断は自分の意志で行われ、自分の決断は自分で責任を持つことが大切。自分にも相手にも好きなことにも正直に向き合うことで、後悔しない決断・質感のある人生を得ることができる。そんなことを思えたアニメでした。

高校時代に一時的にサポートとして合唱部に所属していたのですが、合奏や合唱はいいですよね。心地よい一体感がありますし、練習の成果を本番一発にかけるドキドキが好きです。特に高校部活という限られた期間での研鑽が問われる活動は見る側でも心を奪われます。福岡では毎年4月の頭に年末の第九合唱を募集しているみたい(参考)なので、次は応募しようと思っています。

私は芸術の中でも特に音楽が好きで、心情を表現する方法として言葉(特に文字)や絵などよりも扱いやすいから好きなんだと思います。自分の想いを言葉で表現する際、自分の語彙がボトルネックになります。アウトプットまでの速度も思考時間の分だけ落ちますし、自分の語彙では表現できない想いが削げ落ちます。その点音楽は頭を空にして、声や音を出すだけで良いです。本作でも、各登場人物の心情が演奏に表れている箇所がいくつもありました。(ちなみに言語学自体は面白いなあと思っていて、ゆる言語ラジオを散歩中によく聞いています)

本作の劇場版をまだ見ていないし、特別編も夏に公開されるみたいなので楽しみです。


突然ですが、わたしは最近知人を亡くしました。共通の知人から「キミから見てあいつはどんな奴だった?」という質問を受け、これに対して答えることができませんでした。頭の中にはその人との日々が想起されるだけで、その思い出に合う言葉を探し、文法を組み立てるという作業ができませんでした。心情を言語化するのが好きではないから出来なかったのか、単に訓練不足なのか、、、

watched’劇場版 PSYCHO-PASS PROVIDENCE’

私の推しである槙島 聖護は当然出ませんでした。PSYCHO-PASSは全話履修済みです。見ていない方(特にIT系)は全話見ましょう。

今作も相変わらず難しいけど、常守朱と狡噛のコンビを見れたので満足です。特に最後5分常守の行動には驚きました。

常守朱の考えはとても好き。どれだけ人工知能が発達しても、頼り切らずに人間が考え議論し続けること自体が大切なことであると思う。

Google Cloud Skills Boostの生成系AIを試した

Google Cloud Skills BoostGenerative AI learning pathが出たと聞いたので、やってみました。動画・ドキュメント・テストの構成で生成系AIについて学べます。

コースごとに以下のようなバッヂがもらえます。生成系AIは現時点で11コースあるみたいです。

他のコース(抜粋)

  • Encoder-Decoder Architecture
  • Attention Mechanism
  • Transformer Models and BERT Model

使い方だけでなく仕組みの部分も解説されているので、全部通して学習すれば大半の人間より生成系AIわかるマンになりそう。私はGoogle Cloud Skills Boostの存在自体初めて知ったので、今後英語, 技術の勉強に活用したいな

Diablo4を始めました

英会話教室に1年ほど通っており、その先生に「一緒にやろう!」と言われたことがDiablo4を知ったきっかけです。βテストが3/25~3/27にあり、そこで気に入ったので、製品版もプレイすることにしました。
普段はlolvalorant,ow2をメインでプレイしており、ハクスラ系の洋ゲーは遊んだことが無かったので新鮮です。
ただ、日本ゲー特有のcuteなキャラクターがいないのが残念です。(召喚士でワンワンやmeow meowを侍らせたかった。。。)

rinnaの対話GPT言語モデルをGoogle Colabで触ってみた

Google Colab(PRO)でrinna/Japanese GPT-NeoX  (Hugging face)を使ってみました。

推論 on Google Colab

Python3にて以下を順次実行します。

#機械学習ライブラリ
!pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

#Hugging Faceのモデルをしようするため
!pip install transformers sentencepiece
import time
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

# トークナイザーとモデルを取得
tokenizer = AutoTokenizer.from_pretrained("rinna/japanese-gpt-neox-3.6b-instruction-sft", use_fast=False)
model = AutoModelForCausalLM.from_pretrained("rinna/japanese-gpt-neox-3.6b-instruction-sft").to("cpu")
--colabでは ここで分割--
# 質問
question = "初夏の季語を5つ教えて"

prompt = f"ユーザー: {question}<NL>システム: "

token_ids = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt")

with torch.no_grad():
    output_ids = model.generate(
        token_ids.to(model.device),
        do_sample=True,
        max_new_tokens=128,
        temperature=0.7,
        repetition_penalty=1.1,
        pad_token_id=tokenizer.pad_token_id,
        bos_token_id=tokenizer.bos_token_id,
        eos_token_id=tokenizer.eos_token_id
    )
output = tokenizer.decode(output_ids.tolist()[0][token_ids.size(1):])
output = output.replace("<NL>", "\n")

print(output)

output:

初夏とは、6月から7月初めまでの数ヶ月間です。この時期に俳句や歌、詩などの詩的な作品でよく使われる季語には、「梅雨」、「立葵」、「紫陽花」、「夏至」、「半夏生」があります。

質問を投げてから回答までに20~30秒程度かかります。

パラメータ比較

rinnaのパラメータはGPT2の2倍強

モデルパラメータ数 [個]
rinna/Japanese GPT-NeoX 36憶
GPT215億
GPT31750億
GPT4非公開

vsGPT3

GPT3とrinnaではどちらが日本語に優れているのでしょうか。

Language Models are Few-Shot Learnersでは、Common Crawl(大規模Webクロールテキスト)の重みが60%です。また、論文のsubmit時点である2020年のインターネット上での日本語の割合は2.2%(参考)です。

上記論文(Language Models are Few-Shot Learners)より.Datasets used to train GPT-3

これらを単純に乗算すると「410B(billion) * 0.6 * 0.022 = 5.412B」となり、rinnaの3.6Bよりも大きいです。したがって、GPT3の方が優れていると言えるのではないでしょうか。GPT3時点でこの差が付いているので、GPT4ではもっと大きな差が付いているんじゃないかなあと思います。

おわり

比較しておいてアレですが、rinnaはトークンが少ないので少々良いPCであればローカル環境で実行できる点がすごいです。(小並感)

Open AIのAPIとは異なり、プロンプトを外部へ渡しているわけではないので、このモデルを独自にファインチューニングすれば、機密情報もある程度学習させれて便利になるのかなあ…

watched ‘WWDC 2023 keynote’

初めて開発者会議をリアルタイムで見ました。

今までのWWDCやGoogleIO2023, Microsoft Build2023は、後日まとめ記事で見たり、podcast(rebuild.fm)で聞いたりするくらいでした。今回は、昨今のLLMブームに関してAppleが何か発表するかな~という気持ちと、AppleのAR/VRヘッドギアに関する発表をいち早く聞きたかったという思いがあり、リアルタイムで見ました。

LLMに関連するのはキーボードのautocorrect,音声入力でGPTとおなじtransformerモデルを使用しているくらいかな。というところ。AR/VRについては約50万円($3,499)のヘッドギアが発売されたこと。いろいろ技術を盛り込んでいるからか、高すぎて私には買えない;;

Apple Vision “Pro”という名前だし、廉価verが発売されるような気がします。家にVR機器がないので、少し無理してでも体験してみたい。。。。

また、WWDCの前にExtended TokyoというWWDCをもっと楽しむためのイベントにClusterで参加していました。次回のWWDCはオフラインでワイワイ見たい。。

watched’ハイスコアガール’1st,2nd season

アーケードゲーム全盛期の90年代を舞台に、ゲームに熱中する男女を描いたラブコメの作品。ストリートファイター6が発売された今に打ってつけで、好きなものに熱中できることの尊さを感じました。

作品を見ながら、小中学生時代を思い出していました。お小遣いだけでは足りずに親の財布からくすねてゲームセンターに行っていたなあ。。。ストリートファイターⅣを気が狂ったようにやっていた当時の小さなゲームセンターは無くなっているようです。けれども、今でも鮮明に店内を思い出せるのが不思議。ところで、昔は1プレイ50円だったんですか Σ(・□・;)

「熱中できるものが無い」という方におススメです。度々登場する名作のキャラクターが本作の良いところでもありますが、著作権的に問題があった(?)ようです。参考

watched ‘怪物’

映画「怪物 /監督_是枝裕和」を見てきました。世界三大映画祭やアカデミー賞の受賞作品は都合が合えば見に行きたいタイプです。メイン子役2名の魅力的な演技に引き込まれました。また、本作は坂本龍一さんの遺作でもあり、特にエンディング音楽は私の好みでした。

以下ネタバレを含む可能性があります

.

.

タイトルとPV的にホラー要素がある映画なのかと思っていました。しかし、ホラー要素は一切なく、小学校周りの諸問題(e.x いじめ)を群像劇の手法で描いた作品でした。前半は、教師にいじめられる我が子持つ母親の視点で、真摯な対応をしない学校側にヘイトが集まるように描かれる。中盤以降、教師視点・子供視点など様々な視点で描かれ、各主要人物で悪者はいなかったと思わせられます。

背景にある問題に対して誰も本質を見ようとせず、表面的な証拠だけで事を進めたこと(=短絡的に行動したこと)が良くなかったのかなあ

という感想が終盤には出てくるが、1人目の視点の時に学校側・教師側へヘイトを向けていた自分の短絡さに反省。

WordPressでブログをつくってみた

このたび自分のブログを作りました

ブログを作ろうと思ったきっかけ

エンジニアとして生きていくにはアウトプットが大切だとは理解しています。今までは何か作ったり、資格を取得した際にQiitaに投稿していましたが、以下理由により、自分のブログを持とうかと考えました。

  • 「Qiitaに質の低い投稿をするな」という言説が目に入ってしまうのもあり、”質より量”が実現できない。(かっこつけてしまう)
  • 技術以外のコンテンツに対し、推敲することで自分の中で咀嚼したい。私はアニメや映画を見ること、美術館やコンサートなどの芸術鑑賞が好きなのですが、3日後には忘れていることが多いので。。

このブログのつくりかた

ロリポップを使っています。こちらを参考にすれば難しいことは考えずに導入できるかと思います。

おわり

お絵描きと同様に、ブログを継続することで1記事あたりに必要な執筆時間も減ってくれれば良いな~