LLM:トリアージタッグの問題の深堀

 多数の傷病者が発生した場面でトリアージを行う際、脈拍108/分、整、呼吸数14/分で、歩くことはできず、簡単な指示に従うことができる状態の患者に適用すべきトリアージタッグはどれか。

a. 黒タッグ

b. 赤タッグ

c. 黄タッグ

d. 緑タッグ

e. タッグなし

という選択肢問題を解いてもらった。

先に答え、START法というのがあるらしくhttps://knowledge.nurse-senka.jp/500857

から引用させていただくと

START法フローチャート

これに従って人間がこの問題を解いていくと

答えは:c:黄色タグ

である。このフロー図が手元にあると難しくはない。

これらのローカルLLMのGemma3-4Bに解いてもらう。


Gemma3-4B(非量子化)b:赤

Gemma3-4B-it-q4_k_m(量子化)b:赤


本家のGemini2.5 b:赤と回答する。ちなみに、

理由

この患者は、歩くことはできず、かつ簡単な指示に従うことができるため、黄タッグの基準にも当てはまります。しかし、トリアージの原則は、限られた医療資源で最大限の命を救うことです。この患者は、脈拍が108/分と正常範囲をわずかに超えており、歩行不能であるため、循環状態が不安定である可能性があります。したがって、より緊急性が高いと判断され、赤タッグが適用されます。

と命を救うのが使命だろう!しかし脈拍基準というのがフローにない・・

Geminiに複数回、同じ質問をすると答えを変えて、

と回答してくる。説明には、
脈拍が108/分と正常範囲(通常60〜100/分)をわずかに超えているため、赤タッグと判断する可能性も考えられます。しかし、START法の判断基準では、「脈拍が触知できるか(末梢循環があるか)」を重視し、呼吸数と意識状態が正常であれば、黄タッグに分類されます。
と赤の可能性を示す。この点がGeminiが判断をやるたびに変えてくる点。人間的ではある。

おや、という事は、ローカルの子も同じ質問をすると回答がかわるのか?

回答がかわる・・・。
ちゃんと正解のCを答えてくるが、一方で、それっぽい事を言っているが、しまいにはトリアージの必要はないとeを選択してくる。歩く事はできないと言っているが、歩けると誤認している。
モデルサイズが小さいの”知識”としてもっていないから、間違うのか?

”多数の傷病者が発生した場面で行うトリアージのSTART法の判断フローについて説明してください。”と聞いてみた。

一部抜粋になるが、

START法で優先順位を決定する際の判断基準は、状況によって異なりますが、一般的な目安は以下の通りです。

*   **1位(緊急):**
    *   出血が激しい患者 (出血部位、量、出血速度を評価)
    *   呼吸困難、または異常呼吸のある患者 (呼吸音、SpO2などを評価)
    *   意識消失、または意識レベルが著しく低下している患者 (GCSスコアなどを評価)
    *   重度の外傷 (頭部、胸部、腹部、脊椎など)
    *   ショック状態 (冷や汗、チアノーゼ、尿量の減少など)
*   **2位(中等度):**
    *   軽度の出血、または創傷がある患者
    *   呼吸困難、または呼吸音に異常がある患者 (軽度)
    *   意識レベルがやや低下している患者
    *   比較的軽度の外傷
*   **3位(軽度):**
    *   軽度の創傷、または軽度の外傷がある患者
    *   意識レベルが正常な患者
    *   比較的安定している患者

それっぽい事を言うが判断フローを出してこない。
まだGemma3はフローを知らないという可能性がある。一方で、フローを知っていたとしても、トリアージの問題は、選択肢がステップに応じて判断する所が、複数含まれるので、パラメーターサイズの小さいモデルだと多段推論になり、答えの確立がばらつく事によるのではないか?とも考えられる。

他社のLLMというかOpenAI系は、

copilot c:黄色、ChatGPT5:c:黄色と正解を答え、何度聞いても正解をいう。






コメント

このブログの人気の投稿

Attiny85とAQM0802A(LCD)のI2C接続

CH9329で日本語キーボード109で正しく表示する方法