From eb0eb26f4cefa4880c895ff017f312e8674f9b73 Mon Sep 17 00:00:00 2001
From: karpathy <andrej.karpathy@gmail.com>
Date: Sat, 22 Nov 2025 14:27:53 -0800
Subject: v0

---
 frontend/src/components/Stage2.jsx | 99 ++++++++++++++++++++++++++++++++++++++
 1 file changed, 99 insertions(+)
 create mode 100644 frontend/src/components/Stage2.jsx

(limited to 'frontend/src/components/Stage2.jsx')
diff --git a/frontend/src/components/Stage2.jsx b/frontend/src/components/Stage2.jsx
new file mode 100644
index 0000000..2550fa6
--- /dev/null
+++ b/frontend/src/components/Stage2.jsx
@@ -0,0 +1,99 @@
+import { useState } from 'react';
+import ReactMarkdown from 'react-markdown';
+import './Stage2.css';
+
+function deAnonymizeText(text, labelToModel) {
+  if (!labelToModel) return text;
+
+  let result = text;
+  // Replace each "Response X" with the actual model name
+  Object.entries(labelToModel).forEach(([label, model]) => {
+    const modelShortName = model.split('/')[1] || model;
+    result = result.replace(new RegExp(label, 'g'), `**${modelShortName}**`);
+  });
+  return result;
+}
+
+export default function Stage2({ rankings, labelToModel, aggregateRankings }) {
+  const [activeTab, setActiveTab] = useState(0);
+
+  if (!rankings || rankings.length === 0) {
+    return null;
+  }
+
+  return (
+    <div className="stage stage2">
+      <h3 className="stage-title">Stage 2: Peer Rankings</h3>
+
+      <h4>Raw Evaluations</h4>
+      <p className="stage-description">
+        Each model evaluated all responses (anonymized as Response A, B, C, etc.) and provided rankings.
+        Below, model names are shown in <strong>bold</strong> for readability, but the original evaluation used anonymous labels.
+      </p>
+
+      <div className="tabs">
+        {rankings.map((rank, index) => (
+          <button
+            key={index}
+            className={`tab ${activeTab === index ? 'active' : ''}`}
+            onClick={() => setActiveTab(index)}
+          >
+            {rank.model.split('/')[1] || rank.model}
+          </button>
+        ))}
+      </div>
+
+      <div className="tab-content">
+        <div className="ranking-model">
+          {rankings[activeTab].model}
+        </div>
+        <div className="ranking-content markdown-content">
+          <ReactMarkdown>
+            {deAnonymizeText(rankings[activeTab].ranking, labelToModel)}
+          </ReactMarkdown>
+        </div>
+
+        {rankings[activeTab].parsed_ranking &&
+         rankings[activeTab].parsed_ranking.length > 0 && (
+          <div className="parsed-ranking">
+            <strong>Extracted Ranking:</strong>
+            <ol>
+              {rankings[activeTab].parsed_ranking.map((label, i) => (
+                <li key={i}>
+                  {labelToModel && labelToModel[label]
+                    ? labelToModel[label].split('/')[1] || labelToModel[label]
+                    : label}
+                </li>
+              ))}
+            </ol>
+          </div>
+        )}
+      </div>
+
+      {aggregateRankings && aggregateRankings.length > 0 && (
+        <div className="aggregate-rankings">
+          <h4>Aggregate Rankings (Street Cred)</h4>
+          <p className="stage-description">
+            Combined results across all peer evaluations (lower score is better):
+          </p>
+          <div className="aggregate-list">
+            {aggregateRankings.map((agg, index) => (
+              <div key={index} className="aggregate-item">
+                <span className="rank-position">#{index + 1}</span>
+                <span className="rank-model">
+                  {agg.model.split('/')[1] || agg.model}
+                </span>
+                <span className="rank-score">
+                  Avg: {agg.average_rank.toFixed(2)}
+                </span>
+                <span className="rank-count">
+                  ({agg.rankings_count} votes)
+                </span>
+              </div>
+            ))}
+          </div>
+        </div>
+      )}
+    </div>
+  );
+}
-- 
cgit v1.2.3