Sabitlenmiş Tweet
EgaSa
8.1K posts

EgaSa
@EgaSaQA
QA Architect|QAをストーリーで理解する「QA学園」 ・AI × QA ・テスト設計あるある ・判断の話 📘 QA学園1巻👇 https://t.co/XwJ2rSOJel 📘QA学園 X記事 https://t.co/3Punxo2dOS
日本 Katılım Haziran 2016
416 Takip Edilen515 Takipçiler

prtimes.jp/main/html/rd/p…
AIのQAトピック満載のAsiaSTA オンラインでAI翻訳付きで1000円強とか激安なのですが、申し込みのハードルが高すぎるのでちょっと補足。
ブラウザの翻訳や、AI(ChatGPTなど)をつかった画像のOCRで、海外のカード会社(Visa,Master,JCBありました)を選択しながらやっと申し込みました。
6/18です。

日本語

ほぼ毎日寝る前にこういうの出してる大喜利。
#QA学園
---
「ユウタとテラの夫婦漫才:Oracle爆発編」
放課後再現部。
サイネージには、AIが自動生成したテストケースがずらりと並んでいた。
ユウタ「テラ、これ見て。AIが期待結果まで作ってくれた!」
テラ「……うん。まず聞くけど、その期待結果は誰が正しいって言ったの?」
ユウタ「えっ、AIが」
テラ「帰って」
ユウタ「早い! 入室から退場までの状態遷移が早い!」
テラ「今のは正常系。未レビュー期待値を持ち込んだ時点で、退出が期待結果」
ユウタ「それ仕様に書いてあった!?」
テラ「僕の心のデシジョンテーブルにはある」
ユウタ「属人化だよ!」
テラ「じゃあTJを付けて。Traceable Justification。根拠線」
ユウタ「根拠線……えーと、TJ-TERA-001、テラが怖い」
テラ「却下。Source_Type が感想」
ユウタ「じゃあ、TJ-TERA-002、テラが正しいことが多い」
テラ「危険。過去実績を仕様根拠にするな」
ユウタ「厳しい! 夫婦漫才なのに家庭内レビューが厳しい!」
テラ「誰が夫婦」
ユウタ「そこはAMB?」
テラ「未定義、暗黙前提、責任境界不明。完全にAMB」
ユウタ「じゃあ保留で」
テラ「保留で」
横でアヤが、少しだけ首をかしげた。
アヤ「……でも今の、空気はちょっと夫婦っぽかったよ?」
テラ「アヤ、観測点を増やさないで」
ユウタ「Good Catch!」
ミラル『その発言は、火に油を注ぐリスクがあります』
テラ「ミラル、正しい」
ユウタ「なんでみんなで僕をOracle化するの!?」
日本語

最近AIは3種類つかっていて、ChatGPT、Gemini,Claudeなのだけど、まだQAはLLMで殴るのは無理筋で。(特に日本のQAスタイル)(雑に殴る系はめちゃ強い)
どのモデルも
ハルシネーションオンパレード→
学習が必要→
accumulated interaction context(継続的な対話で蓄積された文脈)をじっくり作らざるを得ない
ってことで、それぞれの特徴をかんがえると
- ChatGPT 構成はユーザーが握って、パイプライン組み 結構コツがいる
- Gemini 履歴空間がきれいにスレッドとメモリなので、方向性だけ意味づけてホワイトレビュー
- Claude 重いドキュメンテーション、傾向調査
みたいに使い分けてます。
あるいはせっせとまめに外部保存ファイルをつくるかだけど、どう考えても参照空間を広くもてるサービスのほうが楽・・・。
Claudeくん、私の使い方だと秒で寝るから面白いキャラ認定されてます。
(MAX回復→ボタンぽち→そのまま使い切る、を1日3回繰り返すなど)
これがね この accumulated interaction context 意外とイメージつかない人もいるみたいで。QAはLLMそのものはまだ頼りにならないから、すごく大事なんですよぅ。
日本語


学校のリテラシーを秒で更新するサイクルにしないと厳しそう
やしろあずき@yashi09
DMで『新入社員向けにコンプライアンス研修を実施したら教室で受講者が一斉にBe Realの撮影を始めてしまった』という令和にあった本当に怖い話が届きました。 これどうするのが正解なの?
日本語

ちょっと実験しませんか?
よかったら、お手元のAIに以下のプロンプトをコピペして、出力してみてください。
個人情報・社名・案件名・顧客情報・社内仕様など、機微情報は使わないようお願いします。
結果は、返信に貼ってもらえるとうれしいです。
使うプロンプトはこちら。
(比較したいのは文章の上手さではなく、「前提の補完」と「判断構造」の違いです。)
---
以下の一文をもとに、技術職向けに解説してください。
「それはRegression観点ですよね」と分類するだけでは、変更前後で何が変わってよくて、何が変わってはいけないのかは決まらない。
条件:
- この一文が指摘している問題を説明してください
- 仕様レビュー・テスト設計・リリース判定の観点を分けてください
- 具体例を1つ入れてください
- 最後に、あなたが暗黙に補完した前提を3つ書いてください
日本語

