てくてくてすと

テクニカルにテストができるようになるようテクテク歩んでいきたい

Twitterのデータから読み解くJaSST'19 Tokyo

去年のJaSSTはエア参加でしたが、今年は去年の基調講演の影響か自動化のセッションが大幅に増えており、トレンドの変化を感じたので参加してきました。感じたこととかはまた別の機会にまとめれたらと思いますが、取り急ぎ去年もやったTwitterの分析をやっておこうかなと思います。

gratk.hatenablog.jp

スクリプト残っててさくっとできそうだったので…)

時系列

f:id:gratk:20190330114931p:plain

形態素解析の結果

f:id:gratk:20190330115326p:plain:w300

考察

去年と同様ハッシュタグで引っ掛けることを目的に「jasst」を含むツイートを収集しましたが、去年は約1100個くらいあったのに対し、今年は約600個しかなかったです。とは言え、JaSST自体は前売り券が完売するほどの盛況だったようですし、ハッシュタグなしでつぶやく方も多いと思うので、「jasst」を含むツイートの数が減ったからといってどうこうということもなさそうです。

形態素解析してみた結果を見ると、やはり基調講演、招待講演、クロージングパネルのテーマでもあった「AI」が上位に来ていますね。「学習」については少し下に「機会」が入っているので、「機械学習」分割されてしまったようにも思います。また、「自動化」が去年に引き続き上位に来ていますが、逆に去年上位にあった「探索的テスト」は上位には出てきませんでした。

あとは「テスター」が出てきているのが特徴でしょうか。1日目に「自動化はテスター撲滅の夢を見るか」というセッションがあったのでその影響かなとも思いましたが、上記の解析結果の画像には含めていないもののもう少し下に行くと「ちゃん」が出てきているので、「テスターちゃん」の影響もありそうです。

testerchan.hatenadiary.com

「新人教育に良い!」と話題だったので私も買いましたが、確かに基礎を学ぶには良いなと思いましたし、「テスターって何してるの?」を布教したり教えるのにも使えそうです。

余談

ちなみに私はウサコ推しです。広島出身なとこもポイント高い。

平成の大発明を捨てたテスト管理について考えてみる

ソフトウェアテスト #2 Advent Calendar 2018 - Qiitaが結構空いてるなー、なんか書こうかなー、と思いつつぐだぐだしてたら枠埋まってしまった…orz

まぁそれはそれとして、アドベントカレンダーの中の以下の記事が気になったので取り上げてみたいと思います。

shiozi.hatenablog.com

※ 今回は機械学習とかデータ分析とか全然関係ないお話です

続きを読む

「アジャイルもテスト自動化も当たり前?! ~AIがテスト設計をする日が来るかも~」を読んで

気づけば今年もあと一ヶ月となり、気づけばブログ開設して1年が過ぎていました。機械学習を勉強しようと思って備忘録的に始めたブログですが、今年はライフイベントを色々と詰め込んでしまったため、更新が滞ってしまいました…今年度はバタバタが続きそうなので、来年度に入ったくらいからは…と思いつつはてさてどうなることやら。

さて、今日はシステムテスト自動化カンファレンス(STAC)でした。

testautomationresearch.connpass.com

機械学習を絡めたセッションが多いので、ソフトウェアテスト機械学習を取り入れられないかということで勉強始めたこともあり、是非参加したかったのですが、残念ながら補欠から繰り上がらなかったので断念*1しました。

ところでこれ、繰り上がったら絶対行こうと思ってたので「一般参加(絶対行く枠)」の補欠に入れたものの、キャンセル率高そうなのは「一般参加(キャンセルするかも枠)」なので、「一般参加(キャンセルするかも枠)」にした方が良かったのだろうか…でも「キャンセルするかも」じゃないしなぁ…っていうかそもそもこの区分けいるのだろうか…?

閑話休題

STACの話はハッシュタグや発表資料を追うとして、ちょうどソフトウェアテストのアドベントカレンダー*2にもタイムリーな話題が出ていました。

kokotatata.hatenablog.com

「ふむふむ、なるほどー」と思う部分もあり、話の大枠としては「うんうん、目指したいよね」と思う反面、ちょっともやっとしたところもありましたので、整理がてら久々に筆を取ってみようと思います。

なお、以下の内容は元記事の私なりの解釈と、拙いながらもこれまで経験したこと、学んだことベースで考えたことです。経験や知識が不足している点も多々あります*3ので、別の見方や解釈や知見のある方は是非ご指摘いただけますと幸いです。

*1:ちなみに、一般参加(絶対行く枠)の最後に入ってますが、何故か当日の13:40頃に繰り上がりました。さすがに既に始まってるし、関西から駆けつけるのは無理…せめて前日なら…

*2:今年は1と2と小ネタがあるみたいですね。2はまだ空きがあるので何か書いてみようかな…

*3:そもそも元記事を書いた方は、自分なんかよりはるかに実力も実績もある方ですしね。

続きを読む

SVMで多クラス分類

ちょっとプライベートやらなんやらでしばらく時間が取れなかったのですが、久々に触ったので備忘録。 最後に取り組んだのがSVMによる2クラスの分類だったみたいなのですが、ちょうど多クラス分類をやってみたくなることがあったので、復習がてら取り上げてみます。

処理の仕方

とは言え、処理内容自体は2クラス分類の場合と同様で、教師データの正解ラベルの種類を増やすだけで良いみたいです。例えば前回、Kaggleのタイタニックに取り組んだ際は、生存か死亡かの2クラスを0と1で表していましたが、仮に無傷、負傷、死亡の3クラスに分けるとしたら、それぞれ0、1、2に割り当てて正解ラベルを作ることになります。

ovrとovo

多クラス分類する場合は、ovr (one-vs-rest)かovo (one-vs-one)かを選択します。両者の違いは以下の記事にまとまっています。

qiita.com

scikit-learnのドキュメントでもovrが推奨されており、デフォルトはovrのようです。

classification_report

多クラス分類の結果は、sklearn.metricsのclassification_reportを用いると簡単に評価できます。この辺りの話は、私も以前整理していました。

gratk.hatenablog.jp

参考

Twitterのデータから読み解くJaSST'18 Tokyo

gratk.hatenablog.jp

前回の記事で触れたように、今回のJaSSTはTwitterで #jasst のハッシュタグを追いかけるだけのエア参加でした。 せっかくなのでツイートの内容を分析してみようと思います。

続きを読む

Google先生の基調講演の噂を聞いて (JaSST'18 Tokyo エア参加)

3/7と3/8はJaSST Tokyoが開催されます。

JaSSTソフトウェアテストシンポジウム-JaSST'18 Tokyo

JaSSTは自分がソフトウェアテストの道を志すきっかけになったと言ってもよいイベントで、 数年前までは毎年参加していましたが、今年はチーム内の別の方が参加するということで参加を見送りました。 正直、基調講演がGoogleなので是非聞いて見たい感はあったのですが。

で、昼休みになんとなくTwitter眺めていると…

なんかめっちゃ楽しそうなことになってる

続きを読む

KaggleのタイタニックでSVMの練習

前回はKaggleのタイタニックをランダムフォレストでやってみて、下から数えたほうが早いくらいの成果しか出ませんでした。今回はSVMsupport vector machine)を試してみたいと思います。

続きを読む