commit ae621ecbb54d0848e24b20e055bb0610bfa492ee
Author: admin <admin@rommark.dev>
Date:   Wed Jun 3 10:25:29 2026 +0000

    Initial release: Multi-provider AI chat with RAG
    
    FastAPI backend (wiki-vector-chat.py) with Odysseus-style frontend.
    Features: multi-provider LLM, Wiki KB + VectorDB RAG, session history,
    chat modes, save-to-wiki, markdown rendering, SSE streaming.
    
    Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>

diff --git a/.gitignore b/.gitignore
new file mode 100644
index 0000000..080e057
--- /dev/null
+++ b/.gitignore
@@ -0,0 +1,18 @@
+# Secrets
+.wiki-api-token
+.htpasswd-wiki
+wiki-chat-providers.json
+
+# Data files
+wiki-kb.json
+vector-db/
+data/
+
+# Backups
+*.bak
+*.bak-zcode
+
+# Old wiki HTML (not part of this project)
+zai-ambassador-team-wiki-old.html
+zai-ambassador-team-wiki.html.bak
+zai-ambassadors-wiki.html
diff --git a/CHANGELOG.md b/CHANGELOG.md
new file mode 100644
index 0000000..063da73
--- /dev/null
+++ b/CHANGELOG.md
@@ -0,0 +1,48 @@
+# Changelog
+
+## v2.0.0 (2026-06-03) — Odysseus UI + Multi-Provider + RAG
+
+### Added
+- Complete Odysseus-style UI with Tokyo Night color palette
+- Multi-provider LLM support (OpenAI, Anthropic, Ollama, OpenRouter, Groq, custom)
+- RAG pipeline: dual-source context from Wiki KB (:8097) + VectorDB (:8099)
+- Per-session RAG toggles (Wiki KB / VectorDB enable/disable)
+- Chat modes: Chat, Code, Brainstorm with mode-specific system prompts
+- Session history with localStorage persistence (up to 50 sessions)
+- Save AI answers as new Q&A entries to Wiki KB
+- Message action buttons: Copy, Redo, Save-to-Wiki on AI responses
+- Markdown rendering in AI replies (bold, italic, code blocks, lists)
+- Provider management: CRUD for custom providers, preset forking with API keys
+- SSE streaming with format detection (OpenAI vs Anthropic)
+- Model picker dropdown in input bar
+- Manage Providers modal with select/edit/delete
+- Quick action chips on welcome screen
+- Mobile responsive layout with sidebar drawer
+
+### Backend (wiki-vector-chat.py)
+- FastAPI service on port 8770
+- Shared API token auth from `/opt/blog/.wiki-api-token`
+- `build_rag_context()` with per-source toggle support
+- `call_llm_stream()` with format auto-detection
+- Anthropic SSE parsing (content_block_delta, message_stop)
+- `POST /chat/save-to-wiki` writes directly to wiki-kb.json
+- `ChatMessage` model extended with rag_wiki, rag_vector, mode fields
+
+### Fixed
+- "Save failed: fetch().json is not a function" — double await
+- RAG chevron toggle checked CSS class instead of state
+- addMessage wrong arguments (empty objects vs string roles)
+- SSE done not breaking outer loop — streamDone flag
+- Welcome screen never hidden — .hidden CSS class + toggle
+- Preset providers not editable — forking with custom- prefix
+- RAG not working — auth tokens for wiki-api and vector-db
+- Anthropic message format — {role, content} not {type, text}
+- Anthropic SSE parsing missing — added content_block_delta handler
+- LLM ignoring RAG context — improved system prompt instructions
+- Markdown showing raw tags in AI replies — renderMd() conversion
+
+## v1.0.0 (2026-05-28) — Initial
+
+- Basic chat UI embedded in wiki
+- Single-provider Z.ai GLM-4 proxy (wiki-chat-server.js on :8098)
+- Wiki KB search integration
diff --git a/README.md b/README.md
new file mode 100644
index 0000000..f54f2ae
--- /dev/null
+++ b/README.md
@@ -0,0 +1,75 @@
+# Zportal Wiki VectorDB Chat
+
+Multi-provider AI chat with RAG (Wiki KB + VectorDB) for the Z.ai portal.
+
+## Architecture
+
+| Component | Port | File | Purpose |
+|-----------|------|------|---------|
+| **wiki-vector-chat** | 8770 | `wiki-vector-chat.py` | FastAPI chat backend — multi-provider LLM, RAG pipeline, SSE streaming |
+| **wiki-api** | 8097 | `wiki-api.py` | KB keyword search over `wiki-kb.json` (1,301 Q&A entries) |
+| **vector-db-service** | 8099 | `vector-db-service.py` | TF-IDF vector search on Discord/Reddit messages |
+| **Frontend** | static | `zportal-chat.html` | Odysseus-style chat UI at `/zportal/chat` |
+| **wiki-chat-server** | 8098 | `wiki-chat-server.py` | Legacy Z.ai GLM-4 proxy (being replaced) |
+| **wiki-chat-proxy** | — | `wiki-chat-proxy.py` | Legacy chat proxy helper |
+
+## Features
+
+- **Multi-provider LLM** — OpenAI, Anthropic, Ollama, OpenRouter, Groq, custom endpoints
+- **RAG pipeline** — Dual-source context from Wiki KB + VectorDB with per-session toggles
+- **Chat modes** — Chat, Code, Brainstorm with mode-specific system prompts
+- **Session history** — localStorage persistence, switch between sessions, auto-save
+- **Save to Wiki** — Save AI answers as new Q&A entries in the Wiki KB
+- **Message actions** — Copy, Redo, Save-to-Wiki buttons on AI responses
+- **Markdown rendering** — Bold, italic, code blocks, lists in AI replies
+- **SSE streaming** — Server-Sent Events for real-time token streaming
+- **Provider management** — CRUD for custom providers, preset forking with API keys
+- **Odysseus UI** — Tokyo Night palette, sidebar, chat bubbles, model picker
+
+## Provider Presets
+
+| ID | Name | Format |
+|----|------|--------|
+| zai-coding | Z.ai Coding Plan | OpenAI |
+| openadapter | OpenAdapter | OpenAI |
+| openrouter | OpenRouter | OpenRouter |
+| crofai | Crof.AI | OpenAI |
+| opencode-zen | Opencode Zen | OpenAI |
+
+## Nginx Config
+
+```nginx
+location = /zportal/chat {
+    default_type text/html;
+    alias /opt/zportal/chat.html;
+}
+location ^~ /zportal/wiki/api/chat/ {
+    proxy_pass http://127.0.0.1:8770/;
+    proxy_http_version 1.1;
+    proxy_set_header Host $host;
+    proxy_set_header X-Real-IP $remote_addr;
+    proxy_buffering off;
+    proxy_cache off;
+    proxy_read_timeout 120s;
+}
+```
+
+## Systemd
+
+```bash
+sudo systemctl restart wiki-vector-chat
+sudo systemctl status wiki-vector-chat
+```
+
+## API Endpoints
+
+| Method | Path | Description |
+|--------|------|-------------|
+| POST | `/chat/message` | Main chat (SSE stream) |
+| POST | `/chat/tunnel` | Server-side token chat |
+| POST | `/chat/save-to-wiki` | Save Q&A to wiki KB |
+| GET | `/providers` | List all providers |
+| GET | `/providers/presets` | Built-in presets |
+| POST | `/providers/save` | Save/edit custom provider |
+| DELETE | `/providers/{id}` | Remove custom provider |
+| GET | `/health` | Health check |
diff --git a/inject_wiki_chat.py b/inject_wiki_chat.py
new file mode 100644
index 0000000..e3a8cab
--- /dev/null
+++ b/inject_wiki_chat.py
@@ -0,0 +1,347 @@
+#!/usr/bin/env python3
+"""Inject VectorDB Chat panel into wiki HTML files.
+
+Usage: python3 inject_wiki_chat.py [--file /path/to/wiki.html]
+If no --file, modifies both ambassador and support wikis in-place.
+"""
+
+import os
+import re
+import sys
+
+WIKI_FILES = [
+    "/opt/blog/zai-ambassador-team-wiki.html",
+    "/opt/blog/zai-support-wiki.html",
+]
+
+CHAT_CSS = """
+/* ── VectorDB Chat Panel ── */
+.vdb-fab{position:fixed;bottom:24px;right:24px;width:56px;height:56px;border-radius:28px;
+background:linear-gradient(135deg,#4a9eff,#a78bfa);border:none;color:#fff;font-size:22px;
+cursor:pointer;box-shadow:0 4px 20px rgba(74,158,255,.35);z-index:999;transition:all .2s;display:flex;align-items:center;justify-content:center}
+.vdb-fab:hover{transform:scale(1.08);box-shadow:0 6px 28px rgba(74,158,255,.45)}
+.vdb-chat-container{position:fixed;bottom:0;right:0;width:420px;height:560px;background:#131620;
+border:1px solid #252a3b;border-radius:16px 16px 0 0;z-index:998;display:flex;
+flex-direction:column;box-shadow:-4px 0 30px rgba(0,0,0,.4);font-family:'Inter',system-ui,sans-serif;
+transition:opacity .25s, transform .25s cubic-bezier(.175,.885,.32,1.275)}
+.vdb-chat-container.hidden{opacity:0;pointer-events:none;transform:translateY(20px)}
+.vdb-chat-header{display:flex;align-items:center;gap:10px;padding:14px 16px;
+background:#0c0e14;border-bottom:1px solid #252a3b;flex-shrink:0}
+.vdb-chat-title{font-size:13px;font-weight:600;color:#e8eaed;flex:1;white-space:nowrap;overflow:hidden;text-overflow:ellipsis}
+.vdb-provider-select{font-size:11px;padding:4px 8px;border:1px solid #333;border-radius:6px;
+background:#1a1d26;color:#ccc;cursor:pointer;outline:none;color:#e8eaed;min-width:120px}
+.vdb-provider-select:focus{border-color:#4a9eff}
+.vdb-toggle{background:none;border:none;color:#888;font-size:18px;cursor:pointer;padding:4px 8px;line-height:1}
+.vdb-toggle:hover{color:#fff}
+.vdb-messages{flex:1;overflow-y:auto;padding:12px 16px;display:flex;flex-direction:column;gap:8px;
+scrollbar-width:4px;scrollbar-thumb:#333}
+.vdb-msg{max-width:85%;padding:10px 14px;border-radius:12px;font-size:13px;line-height:1.5;
+color:#b0b5bc;word-wrap:break-word}
+.vdb-msg-user{align-self:flex-end;background:#1e3a5f;border:1px solid #2a4070;margin-left:auto}
+.vdb-msg-assistant{align-self:flex-start;background:#1a1f2e;border:1px solid #252a3b}
+.vdb-msg-meta{font-size:10px;color:#666;margin-top:4px;display:flex;gap:8px;align-items:center}
+.vdb-msg-provider{background:rgba(74,158,255,.1);color:#4a9eff;padding:1px 6px;border-radius:3px;font-weight:600}
+.vdb-msg-error{background:rgba(248,113,113,.1);color:#f87171;border-color:rgba(248,113,113,.3)}
+.vdb-typing{font-size:11px;color:#7c8497;font-style:italic;padding:8px 16px 0;display:none}
+.vdb-typing.active{display:block}
+.vdb-input-row{display:flex;gap:8px;padding:12px 16px;border-top:1px solid #252a3b;
+background:#0c0e14;flex-shrink:0}
+.vdb-input{flex:1;padding:10px 12px;border:1px solid #333;border-radius:8px;
+background:#1a1d26;color:#e8eaed;font-size:13px;font-family:inherit;resize:none;
+outline:none;min-height:20px;max-height:80px;line-height:1.4}
+.vdb-input:focus{border-color:#4a9eff}
+.vdb-send{padding:10px 18px;border:1px solid #333;border-radius:8px;background:rgba(74,158,255,.1);
+color:#4a9eff;font-weight:600;font-size:12px;cursor:pointer;white-space:nowrap;
+transition:all .15s}
+.vdb-send:hover{background:rgba(74,158,255,.2);color:#fff}
+.vdb-send:disabled{opacity:.4;cursor:not-allowed}
+.vdb-settings{border-top:1px solid #252a3b;padding:12px 16px;display:none}
+.vdb-settings-row{display:flex;gap:8px;margin-bottom:8px;align-items:center}
+.vdb-settings-row label{font-size:11px;color:#888;width:70px;flex-shrink:0}
+.vdb-settings-row input,.vdb-settings-row select{flex:1;padding:6px 8px;border:1px solid #333;
+border-radius:4px;background:#1a1d26;color:#e8eaed;font-size:11px}
+.vdb-settings-btn{padding:4px 12px;border-radius:4px;font-size:10px;cursor:pointer;
+border:1px solid #333;background:#1a1d26;color:#aaa;transition:all .15s}
+.vdb-settings-btn:hover{color:#fff;border-color:#444}
+.vdb-settings-btn.danger{color:#f87171;border-color:rgba(248,113,113,.3)}
+@media(max-width:600px){
+.vdb-chat-container{width:100vw;height:100vh;border-radius:0;right:0;bottom:0}
+}
+"""
+
+CHAT_HTML = """
+<div id="vdb-chat" class="vdb-chat-container hidden" style="display:none">
+<div class="vdb-chat-header">
+<span class="vdb-chat-title">VectorDB Chat</span>
+<select id="vdb-provider-select" class="vdb-provider-select"></select>
+<button id="vdb-toggle" class="vdb-toggle">&#x2014;</button>
+</div>
+<div class="vdb-messages" id="vdb-chat-messages"></div>
+<div class="vdb-typing" id="vdb-typing"> thinking...</div>
+<div class="vdb-input-row">
+<textarea id="vdb-input" class="vdb-input" placeholder="Ask about Z.ai wiki, community issues..." rows="1"></textarea>
+<button id="vdb-send" class="vdb-send">Send</button>
+</div>
+<div class="vdb-settings" id="vdb-settings">
+<div style="font-size:11px;color:#888;margin-bottom:8px;font-weight:600;text-transform:uppercase;letter-spacing:.5px">Custom Provider</div>
+<div class="vdb-settings-row"><label>Name</label><input id="vdb-cust-name" placeholder"My Provider"></div></div>
+<div class="vdb-settings-row"><label>API URL</label><input id="vdb-cust-url" placeholder="https://api.example.com/v1"></div></div>
+<div class="vdb-settings-row"><label>Model</label><input id="vdb-cust-model" placeholder="gpt-4o-mini"></div></div>
+<div class="vdb-settings-row"><label>API Key</label><input id="vdb-cust-key" type="password" placeholder="sk-..."></div></div>
+<div style="display:flex;gap:6px;margin-top:8px">
+<button id="vdb-cust-save" class="vdb-settings-btn">Save Provider</button>
+<button id="vdb-cust-cancel" class="vdb-settings-btn danger">Cancel</button>
+</div>
+</div>
+</div>
+<button id="vdb-chat-btn" class="vdb-fab" title="Open Wiki Chat">&#x1F4AC;</button>
+"""
+
+CHAT_JS = """
+(function(){
+const CHAT_API = (function(){
+ const p = location.pathname;
+ return p.endsWith('/') ? p : p + '/';
+})();
+const $ = id => document.getElementById(id);
+let _providers = [];
+let _activeProvider = null;
+let _history = [];
+let _isStreaming = false;
+
+function esc(s){ if(!s) return ''; const d=document.createElement('div'); d.textContent=s; return d.innerHTML; }
+
+function providerIcon(p){ return p.icon || '\u2B99'; }
+function providerLabel(p){ return p.icon + ' ' + p.name; }
+
+function renderProviders(){
+ const sel = $('vdb-provider-select');
+ sel.innerHTML = '<option value="">Select provider...</option>';
+ _providers.forEach(p => {
+   const opt = document.createElement('option');
+   opt.value = p.id;
+   opt.textContent = providerLabel(p);
+   if(_activeProvider && p.id === _activeProvider.id) opt.selected = true;
+   sel.appendChild(opt);
+ });
+}
+
+function addMsg(content, isUser, meta){
+ const msgs = $('vdb-chat-messages');
+ const div = document.createElement('div');
+ div.className = 'vdb-msg vdb-msg-' + (isUser ? 'user' : 'assistant');
+ let html = '';
+ if(meta && meta.provider) html += '<div class="vdb-msg-meta"><span class="vdb-msg-provider">' + providerIcon(meta.provider) + ' ' + meta.provider.name + '</span></div>';
+ if(meta && meta.error) { div.className += ' vdb-msg-error'; html = content; }
+ else { html += esc(content).replace(/\\n/g, '<br>'); }
+ div.innerHTML = html;
+ msgs.appendChild(div);
+ msgs.scrollTop = msgs.scrollHeight;
+ return div;
+}
+
+function setStreaming(on){
+ _isStreaming = on;
+ $('vdb-typing').className = 'vdb-typing' + (on ? ' active' : '');
+ $('vdb-send').disabled = on;
+}
+
+async function sendMessage(){
+ const input = $('vdb-input');
+ const text = (input.value || '').trim();
+ if(!text || !_activeProvider || _isStreaming) return;
+ _history.push({role:'user', content:text});
+ addMsg(text, true, null);
+ input.value = '';
+ input.style.height = 'auto';
+ setStreaming(true);
+
+ try{
+   const resp = await fetch(CHAT_API + 'chat/message', {
+     method:'POST',
+     headers:{'Content-Type':'application/json'},
+     body:JSON.stringify({message:text, provider_id:_activeProvider.id, history:_history})
+   });
+   const reader = resp.body.getReader();
+   const decoder = new TextDecoder();
+   let buf = '';
+   let fullText = '';
+   let assistantDiv = null;
+
+   while(true){
+     const {done, value} = await reader.read();
+     if(value) buf += decoder.decode(value, {stream:true});
+     if(done) break;
+     const lines = buf.split('\\n');
+     buf = lines.pop(); // keep incomplete line
+     for(const line of lines){
+       if(!line.startsWith('data: ') || !line.slice(5)) continue;
+       try{
+         const chunk = JSON.parse(line.slice(5));
+         if(chunk.type === 'done'){ setStreaming(false); break; }
+         if(chunk.type === 'error'){
+           if(!assistantDiv) assistantDiv = addMsg(chunk.delta, false, {error:true});
+           else assistantDiv.textContent += chunk.delta;
+           continue;
+         }
+         if(chunk.type === 'delta'){
+           if(!assistantDiv) assistantDiv = addMsg('', false, {provider:_activeProvider});
+           fullText += chunk.delta;
+           assistantDiv.innerHTML = esc(fullText.replace(/\\n/g, '<br>'));
+           assistantDiv.scrollIntoView({block:'nearest', behavior:'smooth'});
+         } else if(chunk.type === 'tool' || chunk.type === 'raw'){
+           if(!assistantDiv) assistantDiv = addMsg('', false, {provider:_activeProvider});
+           assistantDiv.innerHTML += esc(chunk.delta).replace(/\\n/g, '<br>');
+         }
+       }catch(e){ /* skip malformed */ }
+     }
+   }
+   // Process remaining buffer
+   if(buf){
+     for(const line of buf.split('\\n')){
+       if(!line.startsWith('data: ')) continue;
+       try{
+         const chunk = JSON.parse(line.slice(5));
+         if(chunk.type === 'delta' && chunk.delta){
+           if(!assistantDiv) assistantDiv = addMsg('', false, {provider:_activeProvider});
+           fullText += chunk.delta;
+           assistantDiv.innerHTML = esc(fullText.replace(/\\n/g, '<br>'));
+         }
+       }catch(e){}
+     }
+   }
+   _history.push({role:'assistant', content:fullText || '(no response)'});
+ } catch(e){
+   addMsg('Error: ' + e.message, false, {error:true});
+ }
+ setStreaming(false);
+}
+
+// Provider selection
+$('vdb-provider-select').addEventListener('change', function(){
+ const pid = this.value;
+ _activeProvider = _providers.find(p => p.id === pid) || null;
+});
+
+// Send button
+$('vdb-send').addEventListener('click', sendMessage);
+$('vdb-input').addEventListener('keydown', function(e){ if(e.key === 'Enter' && !e.shiftKey){ e.preventDefault(); sendMessage(); }});
+
+// Toggle chat panel
+let _chatOpen = false;
+$('vdb-chat-btn').addEventListener('click', function(){
+ _chatOpen = !_chatOpen;
+ const chat = $('vdb-chat');
+ chat.classList.toggle('hidden', !_chatOpen);
+ this.textContent = _chatOpen ? '\u2715' : '\u1F4AC';
+ this.title = _chatOpen ? 'Close Chat' : 'Open Wiki Chat';
+});
+
+$('vdb-toggle').addEventListener('click', function(){
+ _chatOpen = false;
+ $('vdb-chat').classList.add('hidden');
+ this.textContent = '\u25B2';
+ $('vdb-chat-btn').textContent = '\u1F4AC';
+ $('vdb-chat-btn').title = 'Open Wiki Chat';
+});
+
+// Settings
+$('vdb-cust-save').addEventListener('click', async function(){
+ const name = $('vdb-cust-name').value.trim();
+ const url = $('vdb-cust-url').value.trim();
+ const model = $('vdb-cust-model').value.trim();
+ const key = $('vdb-cust-key').value.trim();
+ if(!name || !url || !model){ alert('Name, URL, and Model are required'); return; }
+ const provider = {id:'custom-'+Date.now(), name:name, base_url:url, model:model,
+   api_key:key, format:'openai', icon:'\u2699', description:'Custom'};
+ // Save via API
+ try{
+   await fetch(CHAT_API + 'providers/save', {
+     method:'POST', headers:{'Content-Type':'application/json'}, body:JSON.stringify(provider)
+   });
+   _providers = await (await fetch(CHAT_API + 'providers')).json();
+   renderProviders();
+   _activeProvider = provider;
+   $('vdb-settings').style.display = 'none';
+   alert('Provider saved!');
+ } catch(e){ alert('Save failed: ' + e.message); }
+});
+
+$('vdb-cust-cancel').addEventListener('click', function(){
+ $('vdb-settings').style.display = 'none';
+});
+
+// Auto-open settings if no providers loaded
+function checkProviders(){
+ if(!_providers.length){
+   $('vdb-settings').style.display = '';
+ }
+}
+
+// Init
+async function init(){
+ try{
+   const [presetsResp, customResp] = await Promise.all([
+     fetch(CHAT_API + 'providers/presets'),
+     fetch(CHAT_API + 'providers')
+   ]);
+   _presets = await presetsResp.json();
+   _custom = await customResp.json();
+   _providers = [..._presets, ..._custom];
+   renderProviders();
+   // Auto-select first available provider
+   if(_providers.length > 0 && !_activeProvider){
+     _activeProvider = _providers[0];
+     renderProviders();
+   }
+   checkProviders();
+ } catch(e){
+   console.error('Chat init error:', e);
+   $('vdb-chat-messages').innerHTML = '<div class="vdb-msg vdb-msg-error">Failed to load chat service.</div>';
+ }
+}
+
+init();
+})();
+"""
+
+
+def inject_chat(html_content: str) -> str:
+    """Inject chat CSS, HTML, and JS into wiki HTML."""
+    # Inject CSS before </style>
+    if "</style>" in html_content:
+        html_content = html_content.replace("</style>", CHAT_CSS + "</style>", 1)
+
+    # Inject HTML before </body>
+    if "</body>" in html_content:
+        html_content = html_content.replace("</body>", CHAT_HTML + "\n<script>" + CHAT_JS + "\n</script>", 1)
+
+    return html_content
+
+
+def main():
+    files = WIKI_FILES
+    # Check for --file argument
+    if "--file" in sys.argv:
+        idx = sys.argv.index("--file") + 1
+        if idx < len(sys.argv):
+            files = [sys.argv[idx]]
+
+    for fpath in files:
+        if not os.path.exists(fpath):
+            print(f"SKIP: {fpath} not found")
+            continue
+        with open(fpath, "r") as f:
+            content = f.read()
+        # Check if already injected
+        if "vdb-chat-container" in content:
+            print(f"SKIP: {fpath} already has chat injected")
+            continue
+        new_content = inject_chat(content)
+        with open(fpath, "w") as f:
+            f.write(new_content)
+        print(f"OK: {fpath} ({len(new_content)} bytes)")
+
+
+if __name__ == "__main__":
+    main()
diff --git a/vector-db-service.py b/vector-db-service.py
new file mode 100644
index 0000000..20eac79
--- /dev/null
+++ b/vector-db-service.py
@@ -0,0 +1,225 @@
+#!/usr/bin/env python3
+"""Z.ai Wiki Vector DB Service
+
+Stores Discord messages as vector embeddings using sentence-transformers.
+Provides a search API for the wiki chat system to query as an additional data source.
+
+Data sources:
+- Server 1346756824233148527 (Z.ai Community)
+- Server 1410352583364841555 (Z.ai Mod Server)
+- Channel 1476364011091136544 (Z.ai Mod Channel)
+
+Endpoints:
+- POST /vector/search  - Search with a query, return top-K matches
+- POST /vector/index    - Add messages to the index
+- GET  /vector/stats    - Get index statistics
+- POST /vector/rebuild  - Rebuild from stored messages
+"""
+
+import json
+import os
+import glob
+import numpy as np
+from flask import Flask, request, jsonify, make_response
+from sentence_transformers import SentenceTransformer
+
+app = Flask(__name__)
+
+DATA_DIR = os.environ.get('VECTOR_DB_DIR', '/opt/blog/vector-db')
+MESSAGES_FILE = os.path.join(DATA_DIR, 'messages.json')
+EMBEDDINGS_FILE = os.path.join(DATA_DIR, 'embeddings.npy')
+META_FILE = os.path.join(DATA_DIR, 'meta.json')
+
+os.makedirs(DATA_DIR, exist_ok=True)
+
+model = None
+embeddings = None
+meta = []  # parallel array: [{id, content, source, author, channel, server, timestamp, link}, ...]
+
+
+def get_model():
+    global model
+    if model is None:
+        print('[VectorDB] Loading sentence-transformer model...')
+        model = SentenceTransformer('all-MiniLM-L6-v2')
+        print('[VectorDB] Model loaded')
+    return model
+
+
+def load_index():
+    global embeddings, meta
+    if os.path.exists(EMBEDDINGS_FILE) and os.path.exists(META_FILE):
+        embeddings = np.load(EMBEDDINGS_FILE)
+        meta = json.load(open(META_FILE))
+        print(f'[VectorDB] Loaded index: {len(meta)} entries, dim={embeddings.shape[1]}')
+    else:
+        embeddings = np.empty((0, 384), dtype=np.float32)
+        meta = []
+        print('[VectorDB] No existing index, starting fresh')
+
+
+def save_index():
+    np.save(EMBEDDINGS_FILE, embeddings)
+    json.dump(meta, open(META_FILE, 'w'))
+    print(f'[VectorDB] Saved index: {len(meta)} entries')
+
+
+def load_messages():
+    """Load raw messages from JSON files"""
+    msgs = []
+    for f in glob.glob(os.path.join(DATA_DIR, 'messages_*.json')):
+        msgs.extend(json.load(open(f)))
+    return msgs
+
+
+@app.after_request
+def add_cors(response):
+    response.headers['Access-Control-Allow-Origin'] = '*'
+    response.headers['Access-Control-Allow-Methods'] = 'POST, GET, OPTIONS'
+    response.headers['Access-Control-Allow-Headers'] = 'Content-Type, Authorization'
+    return response
+
+
+@app.route('/vector/stats', methods=['GET', 'OPTIONS'])
+def stats():
+    if request.method == 'OPTIONS':
+        return make_response('', 200)
+    sources = {}
+    for m in meta:
+        s = m.get('source', 'unknown')
+        sources[s] = sources.get(s, 0) + 1
+    return jsonify({
+        'total': len(meta),
+        'dimension': int(embeddings.shape[1]) if embeddings.shape[0] > 0 else 0,
+        'sources': sources,
+        'is_indexed': len(meta) > 0,
+    })
+
+
+@app.route('/vector/search', methods=['POST', 'OPTIONS'])
+def search():
+    if request.method == 'OPTIONS':
+        return make_response('', 200)
+    try:
+        body = request.get_json(force=True)
+        query = body.get('query', '')
+        top_k = min(body.get('top_k', 10), 50)
+
+        if not query or embeddings.shape[0] == 0:
+            return jsonify({'results': [], 'query': query})
+
+        mdl = get_model()
+        q_emb = mdl.encode([query], normalize_embeddings=True).astype(np.float32)
+
+        # Cosine similarity (embeddings are already normalized)
+        scores = (embeddings @ q_emb.T).flatten()
+
+        top_idx = np.argsort(scores)[::-1][:top_k]
+
+        results = []
+        for i in top_idx:
+            if scores[i] < 0.1:  # threshold
+                break
+            results.append({
+                'content': meta[i]['content'],
+                'source': meta[i].get('source', ''),
+                'author': meta[i].get('author', ''),
+                'channel': meta[i].get('channel', ''),
+                'server': meta[i].get('server', ''),
+                'timestamp': meta[i].get('timestamp', ''),
+                'link': meta[i].get('link', ''),
+                'score': float(scores[i]),
+            })
+
+        return jsonify({'results': results, 'query': query, 'total': len(meta)})
+    except Exception as e:
+        return jsonify({'error': str(e)}), 500
+
+
+@app.route('/vector/index', methods=['POST', 'OPTIONS'])
+def index_messages():
+    if request.method == 'OPTIONS':
+        return make_response('', 200)
+    try:
+        body = request.get_json(force=True)
+        messages = body.get('messages', [])
+        source = body.get('source', 'unknown')
+
+        if not messages:
+            return jsonify({'error': 'messages required'}), 400
+
+        global embeddings, meta
+
+        mdl = get_model()
+        texts = [m.get('content', '')[:2000] for m in messages]
+        new_emb = mdl.encode(texts, normalize_embeddings=True, show_progress_bar=False,
+                              batch_size=64).astype(np.float32)
+
+        start_idx = len(meta)
+        for m in messages:
+            meta.append({
+                'id': m.get('id', ''),
+                'content': m.get('content', ''),
+                'source': source,
+                'author': m.get('author', ''),
+                'channel': m.get('channel', ''),
+                'server': m.get('server', ''),
+                'timestamp': m.get('timestamp', ''),
+                'link': m.get('link', ''),
+            })
+
+        if embeddings.shape[0] == 0:
+            embeddings = new_emb
+        else:
+            embeddings = np.vstack([embeddings, new_emb])
+
+        save_index()
+        return jsonify({'indexed': len(messages), 'total': len(meta)})
+    except Exception as e:
+        return jsonify({'error': str(e)}), 500
+
+
+@app.route('/vector/rebuild', methods=['POST', 'OPTIONS'])
+def rebuild():
+    if request.method == 'OPTIONS':
+        return make_response('', 200)
+    try:
+        messages = load_messages()
+        if not messages:
+            return jsonify({'error': 'No messages found. Run scraper first.'}), 404
+
+        global embeddings, meta
+        meta = []
+        mdl = get_model()
+
+        # Filter out empty/short messages
+        valid = [m for m in messages if len(m.get('content', '').strip()) > 10]
+        print(f'[VectorDB] Rebuilding index from {len(valid)} valid messages...')
+
+        texts = [m.get('content', '')[:2000] for m in valid]
+        embeddings = mdl.encode(texts, normalize_embeddings=True,
+                                show_progress_bar=True, batch_size=128).astype(np.float32)
+
+        for m in valid:
+            meta.append({
+                'id': m.get('id', ''),
+                'content': m.get('content', ''),
+                'source': m.get('source', ''),
+                'author': m.get('author', ''),
+                'channel': m.get('channel', ''),
+                'server': m.get('server', ''),
+                'timestamp': m.get('timestamp', ''),
+                'link': m.get('link', ''),
+            })
+
+        save_index()
+        return jsonify({'indexed': len(meta), 'total_valid': len(valid), 'total_raw': len(messages)})
+    except Exception as e:
+        return jsonify({'error': str(e)}), 500
+
+
+if __name__ == '__main__':
+    load_index()
+    port = int(os.environ.get('VECTOR_DB_PORT', 8099))
+    print(f'[VectorDB] Service running on port {port}')
+    app.run(host='0.0.0.0', port=port)
diff --git a/wiki-api.py b/wiki-api.py
new file mode 100755
index 0000000..6fbe90c
--- /dev/null
+++ b/wiki-api.py
@@ -0,0 +1,171 @@
+#!/usr/bin/env python3
+"""Z.ai Wiki KB Search API - token-protected"""
+import json, os, sys, urllib.parse, hashlib
+from http.server import HTTPServer, BaseHTTPRequestHandler
+
+KB_PATH = "/opt/blog/wiki-kb.json"
+TOKEN_PATH = "/opt/blog/.wiki-api-token"
+PORT = 8097
+LOG_PATH = "/opt/blog/data/search-logs.json"
+MAX_LOG_ENTRIES = 5000
+
+def load_logs():
+    if os.path.exists(LOG_PATH):
+        try:
+            with open(LOG_PATH) as f:
+                return json.load(f)
+        except:
+            pass
+    return []
+
+def save_logs(logs):
+    os.makedirs(os.path.dirname(LOG_PATH), exist_ok=True)
+    # Keep only last MAX_LOG_ENTRIES
+    with open(LOG_PATH, 'w') as f:
+        json.dump(logs[-MAX_LOG_ENTRIES:], f)
+
+def log_search(source, query, results, meta=None):
+    logs = load_logs()
+    entry = {
+        "ts": __import__('time').strftime("%Y-%m-%dT%H:%M:%SZ"),
+        "source": source,
+        "query": query,
+        "result_count": len(results) if isinstance(results, list) else 0,
+        "top_results": [
+            {"q": r.get("q", r.get("content", ""))[:100], "score": r.get("score", 0), "source": r.get("source", "")}
+            for r in (results[:3] if isinstance(results, list) else [])
+        ],
+    }
+    if meta:
+        entry["meta"] = meta
+    logs.append(entry)
+    save_logs(logs)
+    return entry
+
+
+
+# Load or generate token
+def load_token():
+    if os.path.exists(TOKEN_PATH):
+        with open(TOKEN_PATH) as f:
+            return f.read().strip()
+    return None
+
+API_TOKEN = load_token()
+
+with open(KB_PATH) as f:
+    KB = json.load(f)
+
+def search_kb(query, topic=None, limit=20):
+    query_lower = query.lower()
+    query_words = set(query_lower.split())
+    results = []
+    for entry in KB:
+        score = 0
+        q_text = entry.get("q", "").lower()
+        a_text = entry.get("a", "").lower()
+        q_words = set(q_text.split())
+        a_words = set(a_text.split())
+        score += len(query_words & q_words) * 3
+        score += len(query_words & a_words) * 1
+        if query_lower in q_text: score += 10
+        if query_lower in a_text: score += 5
+        if topic and entry.get("topic", "").lower() != topic.lower(): score -= 50
+        if score > 0:
+            results.append({**entry, "score": score})
+    results.sort(key=lambda x: -x["score"])
+    return results[:limit]
+
+def check_auth(params, headers):
+    if not API_TOKEN:
+        return False
+    # Check query param ?token=...
+    token = params.get("token", [""])[0]
+    if token == API_TOKEN:
+        return True
+    # Check header Authorization: Bearer ...
+    auth = headers.get("Authorization", "")
+    if auth.startswith("Bearer "):
+        if auth[7:] == API_TOKEN:
+            return True
+    # Check header X-API-Key
+    api_key = headers.get("X-Api-Key", "")
+    if api_key == API_TOKEN:
+        return True
+    return False
+
+class Handler(BaseHTTPRequestHandler):
+    def do_GET(self):
+        parsed = urllib.parse.urlparse(self.path)
+        params = urllib.parse.parse_qs(parsed.query)
+
+        if not check_auth(params, self.headers):
+            self.send_response(401)
+            self.send_header("Content-Type", "application/json")
+            self.send_header("Access-Control-Allow-Origin", "*")
+            self.end_headers()
+            self.wfile.write(json.dumps({"error": "Unauthorized. Provide ?token=YOUR_TOKEN or Authorization: Bearer YOUR_TOKEN"}).encode())
+            return
+
+        if parsed.path == "/search":
+            query = params.get("q", [""])[0]
+            topic = params.get("topic", [None])[0]
+            limit = int(params.get("limit", [20])[0])
+            if not query:
+                body = json.dumps({"error": "Missing ?q= parameter"}).encode()
+            else:
+                results = search_kb(query, topic, limit)
+                log_search("kb", query, results, {"topic": topic, "limit": limit, "ip": self.headers.get("X-Real-IP", self.client_address[0])})
+                body = json.dumps({"query": query, "count": len(results), "results": results}, ensure_ascii=False).encode()
+        elif parsed.path == "/kb":
+            body = json.dumps(KB, ensure_ascii=False).encode()
+        elif parsed.path == "/logs":
+            logs = load_logs()
+            body = json.dumps({"total": len(logs), "logs": logs[::-1]}, ensure_ascii=False).encode()
+        else:
+            self.send_response(404)
+            self.end_headers()
+            return
+
+        self.send_response(200)
+        self.send_header("Content-Type", "application/json")
+        self.send_header("Access-Control-Allow-Origin", "*")
+        self.send_header("Content-Length", len(body))
+        self.end_headers()
+        self.wfile.write(body)
+
+    def do_DELETE(self):
+        parsed = urllib.parse.urlparse(self.path)
+        params = urllib.parse.parse_qs(parsed.query)
+        if not check_auth(params, self.headers):
+            self.send_response(401)
+            self.send_header("Content-Type", "application/json")
+            self.send_header("Access-Control-Allow-Origin", "*")
+            self.end_headers()
+            self.wfile.write(json.dumps({"error": "Unauthorized"}).encode())
+            return
+        if parsed.path == "/logs":
+            save_logs([])
+            self.send_response(200)
+            self.send_header("Content-Type", "application/json")
+            self.send_header("Access-Control-Allow-Origin", "*")
+            self.end_headers()
+            self.wfile.write(json.dumps({"cleared": True}).encode())
+            return
+        self.send_response(404)
+        self.end_headers()
+
+    def do_OPTIONS(self):
+        self.send_response(200)
+        self.send_header("Access-Control-Allow-Origin", "*")
+        self.send_header("Access-Control-Allow-Methods", "GET, POST, DELETE, OPTIONS")
+        self.send_header("Access-Control-Allow-Headers", "Authorization, X-Api-Key, Content-Type")
+        self.end_headers()
+
+    def log_message(self, format, *args):
+        pass
+
+if __name__ == "__main__":
+    print(f"Wiki KB API running on port {PORT}")
+    server = HTTPServer(("127.0.0.1", PORT), Handler)
+    server.serve_forever()
diff --git a/wiki-chat-proxy.py b/wiki-chat-proxy.py
new file mode 100755
index 0000000..9b4a2f0
--- /dev/null
+++ b/wiki-chat-proxy.py
@@ -0,0 +1,54 @@
+#!/usr/bin/env python3
+"""Wiki Chat Proxy - Proxies chat requests to z.ai GLM-4-Plus"""
+
+import json
+import os
+import urllib.request
+
+ZAI_TOKEN = os.environ.get('ZAI_API_TOKEN', '')
+
+def handler(event):
+    try:
+        if event.get('method') != 'POST':
+            return {'status': 405, 'body': 'Method not allowed'}
+        
+        body = json.loads(event.get('body', '{}'))
+        messages = body.get('messages', [])
+        
+        if not messages:
+            return {'status': 400, 'body': json.dumps({'error': 'messages required'})}
+        
+        api_url = 'https://api.z.ai/api/coding/paas/v4/chat/completions'
+        
+        payload = json.dumps({
+            'model': 'glm-4-plus',
+            'messages': messages,
+            'temperature': 0.7,
+            'max_tokens': 2000,
+        }).encode()
+        
+        headers = {'Content-Type': 'application/json'}
+        if ZAI_TOKEN:
+            headers['Authorization'] = 'Bearer ' + ZAI_TOKEN
+        
+        req = urllib.request.Request(api_url, data=payload, headers=headers, method='POST')
+        
+        try:
+            with urllib.request.urlopen(req, timeout=60) as resp:
+                data = json.loads(resp.read().decode())
+                content = data.get('choices', [{}])[0].get('message', {}).get('content', '')
+                return {
+                    'status': 200,
+                    'headers': {'Content-Type': 'application/json'},
+                    'body': json.dumps({'response': content})
+                }
+        except urllib.error.HTTPError as e:
+            err_body = e.read().decode() if e.fp else ''
+            try:
+                err_json = json.loads(err_body)
+                err_msg = err_json.get('error', {}).get('message', err_json.get('message', str(e)))
+            except:
+                err_msg = str(e)
+            return {'status': e.code, 'body': json.dumps({'error': err_msg})}
+    except Exception as e:
+        return {'status': 500, 'body': json.dumps({'error': str(e)})}
diff --git a/wiki-chat-server.py b/wiki-chat-server.py
new file mode 100755
index 0000000..5a3d7c7
--- /dev/null
+++ b/wiki-chat-server.py
@@ -0,0 +1,90 @@
+#!/usr/bin/env python3
+"""Wiki Chat LLM Proxy Server on port 8098 using Flask"""
+
+import json
+import os
+import urllib.request
+from flask import Flask, request, jsonify, make_response
+
+app = Flask(__name__)
+
+ZAI_TOKEN = os.environ.get('ZAI_API_TOKEN', '')
+
+@app.after_request
+def add_cors(response):
+    h = 'Access-Control-Allow-Origin'
+    response.headers[h] = '*'
+    response.headers['Access-Control-Allow-Methods'] = 'POST, OPTIONS'
+    response.headers['Access-Control-Allow-Headers'] = 'Content-Type, Authorization'
+    return response
+
+def call_zai(messages, token=None):
+    api_url = 'https://api.z.ai/api/coding/paas/v4/chat/completions'
+    payload = json.dumps({
+        'model': 'glm-4-plus',
+        'messages': messages,
+        'temperature': 0.7,
+        'max_tokens': 2000,
+    }).encode()
+    headers = {'Content-Type': 'application/json'}
+    if token:
+        headers['Authorization'] = 'Bearer ' + token
+    req = urllib.request.Request(api_url, data=payload, headers=headers, method='POST')
+    with urllib.request.urlopen(req, timeout=60) as resp:
+        data = json.loads(resp.read().decode())
+        return data.get('choices', [{}])[0].get('message', {}).get('content', '')
+
+@app.route('/chat/wiki', methods=['POST', 'OPTIONS'])
+def chat_wiki():
+    if request.method == 'OPTIONS':
+        return make_response('', 200)
+    try:
+        body = request.get_json(force=True)
+        messages = body.get('messages', [])
+        if not messages:
+            return jsonify({'error': 'messages required'}), 400
+        token = body.get('token') or ZAI_TOKEN
+        if not token:
+            return jsonify({'error': 'No token provided'}), 401
+        content = call_zai(messages, token)
+        return jsonify({'response': content})
+    except urllib.error.HTTPError as e:
+        err_body = e.read().decode() if e.fp else ''
+        try:
+            err_json = json.loads(err_body)
+            err_msg = err_json.get('error', {}).get('message', err_json.get('message', str(e)))
+        except Exception:
+            err_msg = str(e)
+        return jsonify({'error': err_msg}), e.code
+    except Exception as e:
+        return jsonify({'error': str(e)}), 500
+
+@app.route('/chat/wiki-tunnel', methods=['POST', 'OPTIONS'])
+def chat_wiki_tunnel():
+    if request.method == 'OPTIONS':
+        return make_response('', 200)
+    try:
+        body = request.get_json(force=True)
+        messages = body.get('messages', [])
+        if not messages:
+            return jsonify({'error': 'messages required'}), 400
+        token = ZAI_TOKEN
+        if not token:
+            return jsonify({'error': 'No server token configured. Use Token mode and paste your API key.'}), 503
+        content = call_zai(messages, token)
+        return jsonify({'response': content})
+    except urllib.error.HTTPError as e:
+        err_body = e.read().decode() if e.fp else ''
+        try:
+            err_json = json.loads(err_body)
+            err_msg = err_json.get('error', {}).get('message', err_json.get('message', str(e)))
+        except Exception:
+            err_msg = str(e)
+        return jsonify({'error': err_msg}), e.code
+    except Exception as e:
+        return jsonify({'error': str(e)}), 500
+
+if __name__ == '__main__':
+    port = int(os.environ.get('WIKI_CHAT_PORT', 8098))
+    print(f'[WikiChat] LLM proxy running on port {port}')
+    app.run(host='0.0.0.0', port=port)
diff --git a/wiki-vector-chat.py b/wiki-vector-chat.py
new file mode 100644
index 0000000..c3d0a76
--- /dev/null
+++ b/wiki-vector-chat.py
@@ -0,0 +1,503 @@
+#!/usr/bin/env python3
+"""Wiki VectorDB Chat — Multi-Provider AI Chat with RAG (KB + VectorDB).
+
+Serves at port 8770, proxied via nginx at /zportal/wiki/api/chat
+Uses wiki-api (:8097) for KB search and vector-db (:8099) for vector search.
+"""
+
+import asyncio
+import json
+import os
+import re
+import time
+import urllib.request
+from pathlib import Path
+
+PROVIDERS_FILE = Path("/opt/blog/wiki-chat-providers.json")
+CUSTOM_PROVIDERS_FILE = Path("/opt/blog/wiki-chat-providers.json")
+
+WIKI_API = "http://127.0.0.1:8097"
+VECTOR_DB = "http://127.0.0.1:8099"
+
+# Shared API token for wiki-api and vector-db
+_API_TOKEN = ""
+try:
+    _API_TOKEN = Path("/opt/blog/.wiki-api-token").read_text().strip()
+except Exception:
+    pass
+
+PRESETS = [
+    {
+        "id": "zai-coding",
+        "name": "Z.ai Coding Plan",
+        "base_url": "https://api.z.ai/api/coding/paas/v4",
+        "model": "glm-4-plus",
+        "format": "openai",
+        "icon": "\u26a1",
+        "description": "Official Z.ai coding plan API",
+    },
+    {
+        "id": "openadapter",
+        "name": "OpenAdapter",
+        "base_url": "https://api.openadapter.com/v1",
+        "model": "gpt-4o-mini",
+        "format": "openai",
+        "icon": "\u1f512",
+        "description": "OpenAdapter unified API",
+    },
+    {
+        "id": "openrouter",
+        "name": "OpenRouter",
+        "base_url": "https://openrouter.ai/api/v1",
+        "model": "anthropic/claude-sonnet-4",
+        "format": "openrouter",
+        "icon": "\u1f6e3",
+        "description": "Model router across providers",
+    },
+    {
+        "id": "crofai",
+        "name": "Crof.AI",
+        "base_url": "https://api.crof.ai/v1",
+        "model": "crof-4-plus",
+        "format": "openai",
+        "icon": "\u1f42a",
+        "description": "Crof AI models",
+    },
+    {
+        "id": "opencode-zen",
+        "name": "Opencode Zen",
+        "base_url": "https://api.zen.opencode.com/v1",
+        "model": "glm-4-plus",
+        "format": "openai",
+        "icon": "\u1f9e0",
+        "description": "Opencode Zen hosted models",
+    },
+]
+
+
+def load_custom_providers():
+    try:
+        if CUSTOM_PROVIDERS_FILE.exists():
+            return json.loads(CUSTOM_PROVIDERS_FILE.read_text())
+    except Exception:
+        pass
+    return []
+
+
+def save_custom_providers(providers):
+    CUSTOM_PROVIDERS_FILE.write_text(json.dumps(providers, indent=2))
+
+
+def get_all_providers():
+    """Return presets + custom providers."""
+    custom = load_custom_providers()
+    seen = {p["id"] for p in PRESETS}
+    result = list(PRESETS)
+    for p in custom:
+        if p.get("id") not in seen:
+            seen.add(p["id"])
+            result.append(p)
+    return result
+
+
+def detect_provider_format(base_url: str) -> str:
+    from urllib.parse import urlparse
+    host = urlparse(base_url).hostname.lower()
+    if "ollama" in host or host in ("localhost", "127.0.0.1"):
+        return "ollama"
+    if "anthropic" in host:
+        return "anthropic"
+    if "openrouter" in host:
+        return "openrouter"
+    if "groq" in host:
+        return "groq"
+    return "openai"
+
+
+async def search_kb(query: str, limit: int = 3) -> str:
+    """Search wiki-kb.json via wiki-api."""
+    try:
+        url = f"{WIKI_API}/search?q={urllib.parse.quote(query)}&limit={limit}&token={_API_TOKEN}"
+        req = urllib.request.Request(url)
+        with urllib.request.urlopen(req, timeout=5) as resp:
+            data = json.loads(resp.read())
+            results = data.get("results", [])
+            if not results:
+                return ""
+            lines = []
+            for r in results[:limit]:
+                q_text = r.get("q", "")
+                a_text = r.get("a", "")
+                topic = r.get("topic", "")
+                score = r.get("_score", 0)
+                lines.append(f"[{topic}] Q: {q_text}\nA: {a_text}")
+            return "\n\n".join(lines)
+    except Exception as e:
+        return f"(KB search error: {e})"
+
+
+async def search_vector(query: str, top_k: int = 5) -> str:
+    """Search vector-db for related Discord/Reddit messages."""
+    try:
+        data = json.dumps({"query": query, "top_k": top_k}).encode()
+        req = urllib.request.Request(
+            f"{VECTOR_DB}/vector/search",
+            data=data,
+            headers={"Content-Type": "application/json", "x-api-key": _API_TOKEN},
+        )
+        with urllib.request.urlopen(req, timeout=8) as resp:
+            result = json.loads(resp.read())
+            hits = result.get("results", [])
+            if not hits:
+                return ""
+            lines = []
+            for h in hits[:top_k]:
+                text = h.get("text", "")[:300]
+                score = h.get("score", 0)
+                source = h.get("source", "unknown")
+                meta = h.get("metadata", {})
+                author = meta.get("author", "")
+                channel = meta.get("channel", "")
+                preview = text.replace("\n", " ")[:200]
+                lines.append(f"[{source}] @{author} in #{channel}: {preview}  (score: {score:.2f})")
+            return "\n\n".join(lines)
+    except Exception as e:
+        return f"(Vector search error: {e})"
+
+
+async def build_rag_context(user_message: str, rag_wiki: bool = True, rag_vector: bool = True) -> str:
+    """Build RAG context from KB + VectorDB searches."""
+    kb_results = ""
+    vec_results = ""
+    tasks = []
+    if rag_wiki:
+        tasks.append(search_kb(user_message, 3))
+    if rag_vector:
+        tasks.append(search_vector(user_message, 5))
+
+    if tasks:
+        results = await asyncio.gather(*tasks)
+        idx = 0
+        if rag_wiki:
+            kb_results = results[idx]; idx += 1
+        if rag_vector:
+            vec_results = results[idx]
+
+    parts = [
+        "You are Z.ai Wiki Assistant. Use ALL the knowledge sources below to answer the user's question.",
+        "Draw from both the Wiki KB and Community Messages. Synthesize information even from partial matches.",
+        "If the context mentions anything relevant, include it in your answer. Be specific — quote authors, channels, and details when available.",
+        "Only say you don't have information if the sources are truly empty or completely unrelated.",
+        "",
+    ]
+    if rag_wiki:
+        parts += ["=== Wiki Knowledge Base ===", kb_results or "(no KB results found)", ""]
+    if rag_vector:
+        parts += ["=== Related Community Messages (Discord/Reddit) ===", vec_results or "(no community messages found)"]
+    if not rag_wiki and not rag_vector:
+        parts.append("(RAG sources disabled for this session)")
+    return "\n".join(parts)
+
+
+# ── LLM Provider Calls ──
+
+def format_messages_openai(system: str, messages: list, model: str) -> dict:
+    """Format for OpenAI-compatible /chat/completions endpoint."""
+    return {"model": model, "messages": [{"role": "system", "content": system}] + messages,
+            "temperature": 0.7, "max_tokens": 2048, "stream": True}
+
+
+def format_messages_anthropic(system: str, messages: list, model: str) -> dict:
+    """Convert OpenAI-format messages to Anthropic format."""
+    anthropic_msgs = []
+    for m in messages:
+        role = "user" if m["role"] == "user" else "assistant"
+        anthropic_msgs.append({"role": role, "content": m["content"]})
+    return {"model": model, "system": system, "messages": anthropic_msgs,
+            "max_tokens": 2048, "stream": True}
+
+
+def format_messages_ollama(system: str, messages: list, model: str) -> dict:
+    """Format for Ollama /api/chat endpoint."""
+    ollama_msgs = []
+    for m in messages:
+        role = "user" if m["role"] == "user" else "assistant"
+        ollama_msgs.append({"role": role, "content": m["content"]})
+    return {"model": model, "messages": ollama_msgs, "stream": True}
+
+
+async def call_llm_stream(provider: dict, system: str, messages: list):
+    """Call LLM provider and yield SSE delta chunks."""
+    base_url = provider["base_url"].rstrip("/")
+    fmt = provider.get("format", detect_provider_format(base_url))
+    api_key = provider.get("api_key", "")
+    model = provider.get("model", "gpt-4o-mini")
+
+    if fmt == "anthropic":
+        payload = format_messages_anthropic(system, messages, model)
+        url = f"{base_url}/v1/messages"
+        headers = {"x-api-key": api_key, "Content-Type": "application/json",
+                  "anthropic-version": "2023-06-01"}
+    elif fmt == "ollama":
+        payload = format_messages_ollama(system, messages, model)
+        url = f"{base_url}/api/chat"
+        headers = {"Content-Type": "application/json"}
+    else:
+        # openai / openrouter / groq / default
+        payload = format_messages_openai(system, messages, model)
+        url = f"{base_url}/chat/completions"
+        headers = {}
+        if api_key:
+            headers["Authorization"] = f"Bearer {api_key}"
+        if fmt == "openrouter":
+            headers["HTTP-OpenRouter-AI-Model"] = model
+        headers["Content-Type"] = "application/json"
+
+    data = json.dumps(payload).encode()
+    req = urllib.request.Request(url, data=data, headers=headers)
+
+    try:
+        with urllib.request.urlopen(req, timeout=60) as resp:
+            reader = resp
+            buf = b""
+            while True:
+                chunk = reader.read(4096)
+                if not chunk:
+                    break
+                buf += chunk
+                while b"\n" in buf:
+                    line, buf = buf.split(b"\n", 1)
+                    line = line.decode("utf-8", errors="replace").strip()
+                    if not line:
+                        continue
+                    if line.startswith("data: "):
+                        data_str = line[5:].strip()
+                        if data_str == "[DONE]":
+                            yield {"type": "done"}
+                            return
+                        try:
+                            chunk_data = json.loads(data_str)
+                        except json.JSONDecodeError:
+                            yield {"delta": data_str, "type": "raw"}
+                            continue
+
+                        # Anthropic SSE format
+                        if fmt == "anthropic":
+                            evt_type = chunk_data.get("type", "")
+                            if evt_type == "content_block_delta":
+                                text = chunk_data.get("delta", {}).get("text", "")
+                                if text:
+                                    yield {"delta": text, "type": "delta"}
+                            elif evt_type == "message_stop":
+                                yield {"type": "done"}
+                                return
+                            elif evt_type == "error":
+                                err_msg = chunk_data.get("error", {}).get("message", str(chunk_data))
+                                yield {"type": "error", "delta": err_msg}
+                                return
+                            continue
+
+                        # OpenAI-compatible SSE format
+                        deltas = chunk_data.get("choices", [{}])[0].get("delta", {})
+                        content = deltas.get("content", "")
+                        if content:
+                            yield {"delta": content, "type": "delta"}
+                        tool_calls = deltas.get("tool_calls")
+                        if tool_calls:
+                            names = [tc.get("function", {}).get("name", "?") for tc in tool_calls]
+                            yield {"delta": f"\n[Using tools: {', '.join(names)}]", "type": "tool"}
+                        finish = chunk_data.get("finish_reason")
+                        if finish:
+                            yield {"type": "done"}
+                    elif line.startswith("event:"):
+                        pass  # SSE event name, skip
+    except urllib.error.HTTPError as e:
+        body = e.read().decode("utf-8", errors="replace")[:500]
+        yield {"type": "error", "delta": f"HTTP {e.code}: {body}"}
+    except Exception as e:
+        yield {"type": "error", "delta": str(e)}
+
+
+# ── FastAPI App ──
+
+try:
+    from fastapi import FastAPI
+    from fastapi.responses import StreamingResponse, JSONResponse, Response
+    from pydantic import BaseModel
+except ImportError:
+    print("Installing fastapi...")
+    os.system("pip install fastapi uvicorn httpx -q")
+    from fastapi import FastAPI
+    from fastapi.responses import StreamingResponse, JSONResponse, Response
+    from pydantic import BaseModel
+
+app = FastAPI(title="Wiki VectorDB Chat")
+
+
+class ChatMessage(BaseModel):
+    message: str
+    provider_id: str = "zai-coding"
+    history: list = []
+    rag_wiki: bool = True
+    rag_vector: bool = True
+    mode: str = "chat"
+
+
+class ProviderSave(BaseModel):
+    id: str
+    name: str
+    base_url: str
+    model: str
+    api_key: str = ""
+    format: str = "openai"
+    icon: str = "\u2b99"
+    description: str = ""
+
+
+@app.get("/providers/presets")
+async def get_presets():
+    return PRESETS
+
+
+@app.get("/providers")
+async def list_providers():
+    return get_all_providers()
+
+
+@app.post("/providers/save")
+async def save_provider(p: ProviderSave):
+    custom = load_custom_providers()
+    p_dict = p.model_dump()
+    # Update or append
+    found = False
+    for i, existing in enumerate(custom):
+        if existing.get("id") == p.id:
+            custom[i] = p_dict
+            found = True
+            break
+    if not found:
+        custom.append(p_dict)
+    save_custom_providers(custom)
+    return {"ok": True, "provider": p_dict}
+
+
+@app.delete("/providers/{provider_id}")
+async def delete_provider(provider_id: str):
+    custom = load_custom_providers()
+    custom = [p for p in custom if p.get("id") != provider_id]
+    save_custom_providers(custom)
+    return {"ok": True}
+
+
+@app.post("/chat/message")
+async def chat_message(msg: ChatMessage):
+    async def generate():
+        providers = get_all_providers()
+        provider = next((p for p in providers if p.get("id") == msg.provider_id), None)
+        if not provider:
+            yield f"data: {json.dumps({'type':'error','delta':'Provider not found'})}\n\n"
+            return
+
+        # Build conversation history
+        messages = []
+        for h in msg.history[-10:]:
+            messages.append(h)
+
+        messages.append({"role": "user", "content": msg.message})
+
+        # Build RAG context with per-session toggles
+        rag_context = await build_rag_context(msg.message, msg.rag_wiki, msg.rag_vector)
+
+        # Mode-specific system prompt additions
+        mode_hints = {
+            "chat": "",
+            "code": "\n\nMODE: Coding. The user is working on code. Provide precise, well-structured code examples with explanations. Use markdown code blocks. Be concise and technical.",
+            "brain": "\n\nMODE: Brainstorm. The user wants creative exploration. Think freely, offer multiple perspectives, suggest unconventional approaches. Be enthusiastic and expansive.",
+        }
+        system_prompt = rag_context + mode_hints.get(msg.mode, "")
+
+        async for chunk in call_llm_stream(provider, system_prompt, messages):
+            data = json.dumps(chunk, ensure_ascii=False)
+            yield f"data: {data}\n\n"
+        yield f"data: {json.dumps({'type':'done'})}\n\n"
+
+    return StreamingResponse(generate(), media_type="text/event-stream",
+                                headers={"Cache-Control": "no-cache", "X-Accel-Buffering": "no"})
+
+
+@app.post("/chat/tunnel")
+async def chat_tunnel(msg: ChatMessage):
+    """Server-side token chat — uses ZAI_API_TOKEN env var if available."""
+    async def generate():
+        providers = get_all_providers()
+        provider = next((p for p in providers if p.get("id") == msg.provider_id), None)
+        if not provider:
+            yield f"data: {json.dumps({'type':'error','delta':'Provider not found'})}\n\n"
+            return
+
+        # Use server-side token if available (for tunnel mode)
+        token = os.environ.get("ZAI_API_TOKEN", "")
+        if token and not provider.get("api_key"):
+            provider = dict(provider)
+            provider["api_key"] = token
+
+        messages = []
+        for h in msg.history[-10:]:
+            messages.append(h)
+        messages.append({"role": "user", "content": msg.message})
+
+        rag_context = await build_rag_context(msg.message)
+
+        async for chunk in call_llm_stream(provider, rag_context, messages):
+            data = json.dumps(chunk, ensure_ascii=False)
+            yield f"data: {data}\n\n"
+        yield f"data: {json.dumps({'type':'done'})}\n\n"
+
+    return StreamingResponse(generate(), media_type="text/event-stream",
+                                headers={"Cache-Control": "no-cache", "X-Accel-Buffering": "no"})
+
+
+@app.get("/health")
+async def health():
+    return {"status": "ok", "providers": len(get_all_providers())}
+
+
+class WikiSave(BaseModel):
+    question: str
+    answer: str
+    topic: str = "chat-saved"
+
+
+@app.post("/chat/save-to-wiki")
+async def save_to_wiki(item: WikiSave):
+    """Save a Q&A pair directly to wiki-kb.json."""
+    try:
+        kb_path = Path("/opt/blog/wiki-kb.json")
+        kb = json.loads(kb_path.read_text())
+        entry = {
+            "q": item.question,
+            "a": item.answer,
+            "topic": item.topic,
+            "author": "chat-assistant",
+            "source": "chat-saved",
+            "timestamp": time.strftime("%Y-%m-%d %H:%M"),
+        }
+        kb.append(entry)
+        kb_path.write_text(json.dumps(kb, ensure_ascii=False, indent=2))
+        return {"ok": True, "total": len(kb)}
+    except Exception as e:
+        return {"ok": False, "error": str(e)}
+
+
+def main():
+    import uvicorn
+    port = 8770
+    for i, arg in enumerate(__import__("sys").argv):
+        if arg == "--port" and i + 1 < len(__import__("sys").argv):
+            port = int(__import__("sys").argv[i + 1])
+    print(f"Wiki VectorDB Chat starting on port {port}")
+    uvicorn.run(app, host="127.0.0.1", port=port, log_level="warning")
+
+
+if __name__ == "__main__":
+    main()
diff --git a/zportal-chat.html b/zportal-chat.html
new file mode 100644
index 0000000..f853de8
--- /dev/null
+++ b/zportal-chat.html
@@ -0,0 +1,1473 @@
+<!DOCTYPE html>
+<html lang="en">
+<head>
+<meta charset="UTF-8">
+<meta name="viewport" content="width=device-width, initial-scale=1.0, viewport-fit=cover">
+<title>Z.ai Chat</title>
+<style>
+/* ── Odysseus Design Tokens ── */
+:root {
+  --bg: #1a1b26;
+  --fg: #c0caf5;
+  --panel: #16161e;
+  --border: #292e42;
+  --red: #f7768e;
+  --accent: #7aa2f7;
+  --accent-secondary: #bb9af7;
+  --green: #9ece6a;
+  --warn: #e0af68;
+  --sidebar-bg: #13141f;
+  --input-bg: #1a1b26;
+  --user-bubble-bg: rgba(122,162,247,.08);
+  --ai-bubble-bg: var(--panel);
+  --bubble-border: var(--border);
+  --font-family: 'Inter', system-ui, -apple-system, sans-serif;
+  --chat-max: 800px;
+}
+
+* { box-sizing: border-box; margin: 0; padding: 0; }
+html, body { height: 100%; height: 100dvh; overflow: hidden; }
+body {
+  background: var(--bg);
+  color: var(--fg);
+  font-family: var(--font-family);
+  display: flex;
+}
+
+/* ── Ecosystem Nav ── */
+.eco-nav {
+  position: fixed; top: 0; left: 0; right: 0; z-index: 300;
+  height: 38px; background: var(--panel); border-bottom: 1px solid var(--border);
+  display: flex; align-items: center; padding: 0 16px; gap: 4px;
+}
+.eco-link { color: var(--fg); opacity: .55; text-decoration: none; font-size: 12px;
+  padding: 5px 10px; border-radius: 6px; transition: all .15s; display: flex; align-items: center; gap: 4px;
+  white-space: nowrap; border-bottom: none; }
+.eco-link:hover { opacity: .85; background: rgba(198,202,245,.06); }
+.eco-link.active { opacity: 1; color: var(--accent); }
+.eco-link.brand { font-weight: 700; opacity: 1; padding: 5px 8px; }
+
+/* ── Layout Shell ── */
+.app-shell {
+  display: flex; width: 100%; height: 100%; padding-top: 38px;
+}
+
+/* ── Sidebar (Odysseus-style) ── */
+.sidebar {
+  width: 252px; min-width: 252px; max-width: 400px;
+  background: var(--sidebar-bg); border-right: 1px solid var(--border);
+  display: flex; flex-direction: column; flex-shrink: 0;
+  transition: width .22s ease, opacity .2s ease, transform .3s cubic-bezier(.25,1,.5,1);
+  position: relative; z-index: 50;
+}
+.sidebar.collapsed { width: 0; min-width: 0; opacity: 0; overflow: hidden; }
+
+.sidebar-header {
+  display: flex; align-items: center; justify-content: space-between;
+  padding: 14px 12px 10px; flex-shrink: 0; gap: 8px;
+}
+.sidebar-brand {
+  display: flex; align-items: center; gap: 8px; cursor: pointer;
+  flex: 1; min-width: 0;
+}
+.sidebar-brand-icon {
+  width: 28px; height: 28px; border-radius: 8px;
+  background: linear-gradient(135deg, var(--accent), var(--secondary));
+  display: flex; align-items: center; justify-content: center; font-size: 14px; flex-shrink: 0;
+}
+.sidebar-brand-title {
+  font-size: .95rem; font-weight: 700; color: var(--red);
+  white-space: nowrap; overflow: hidden; text-overflow: ellipsis;
+  letter-spacing: .02em;
+}
+.sidebar-toggle-btn {
+  background: none; border: none; color: var(--fg); opacity: .45;
+  cursor: pointer; padding: 5px; border-radius: 6px; display: flex; align-items: center;
+  transition: opacity .15s, background .15s;
+}
+.sidebar-toggle-btn:hover { opacity: .75; background: rgba(198,202,245,.08); }
+
+.sidebar-inner {
+  flex: 1; overflow-y: auto; overflow-x: hidden;
+  display: flex; flex-direction: column; gap: 2px;
+  padding: 4px 8px 8px; min-height: 0;
+  scrollbar-width: none;
+}
+.sidebar-inner::-webkit-scrollbar { display: none; }
+
+.list-item {
+  display: flex; align-items: center; gap: 8px;
+  padding: 7px 10px; border-radius: 8px; cursor: pointer;
+  font-size: .82rem; color: var(--fg); opacity: .72;
+  transition: background .12s, opacity .12s;
+  white-space: nowrap; user-select: none; position: relative;
+}
+.list-item:hover { background: rgba(198,202,245,.07); opacity: .9; }
+.list-item.active { background: rgba(247,118,142,.1); opacity: 1; }
+.list-item svg { flex-shrink: 0; opacity: .55; }
+.list-item:hover svg { opacity: .8; }
+.list-item.active svg { opacity: 1; color: var(--red); }
+.grow { flex: 1; min-width: 0; overflow: hidden; text-overflow: ellipsis; }
+
+.section { margin-top: 4px; }
+.section-header-flex {
+  display: flex; align-items: center; gap: 6px;
+  padding: 6px 10px 4px; cursor: default;
+  font-size: .7rem; font-weight: 600; text-transform: uppercase;
+  letter-spacing: .08em; color: var(--fg); opacity: .35;
+  user-select: none;
+}
+.section-title { display: flex; align-items: center; gap: 5px; }
+.section-icon { flex-shrink: 0; }
+
+.provider-item { position: relative; }
+.provider-item .p-actions {
+  display: none; position: absolute; right: 6px; top: 50%; transform: translateY(-50%); gap: 2px;
+}
+.provider-item:hover .p-actions { display: flex; }
+.p-action-btn {
+  width: 22px; height: 22px; border: none; border-radius: 4px;
+  background: transparent; color: var(--fg); opacity: .35; font-size: 11px;
+  cursor: pointer; display: flex; align-items: center; justify-content: center;
+  transition: all .12s;
+}
+.p-action-btn:hover { opacity: .7; background: rgba(198,202,245,.1); }
+.p-action-btn.p-del:hover { color: var(--red); opacity: 1; }
+.p-check { color: var(--green); font-size: 11px; opacity: 0; transition: opacity .15s; }
+.provider-item.active .p-check { opacity: 1; }
+
+.sidebar-footer {
+  padding: 8px; border-top: 1px solid var(--border); flex-shrink: 0;
+}
+.new-provider-btn {
+  width: 100%; padding: 8px; border-radius: 8px;
+  border: 1px dashed var(--border); background: transparent;
+  color: var(--fg); opacity: .45; font-size: .8rem; cursor: pointer;
+  font-family: inherit; display: flex; align-items: center; justify-content: center; gap: 6px;
+  transition: all .15s;
+}
+.new-provider-btn:hover { opacity: .75; border-color: var(--red); color: var(--red); }
+
+/* ── Main Chat Container ── */
+.chat-container {
+  flex: 1; display: flex; flex-direction: column;
+  padding: 0 20px; overflow: hidden; position: relative;
+  min-height: 0; min-width: 0;
+}
+
+.chat-top-bar {
+  display: flex; align-items: center; justify-content: center;
+  flex-shrink: 0; position: relative; z-index: 2;
+  padding: 6px 0 2px; min-height: 28px;
+}
+.chat-meta-overlay {
+  font-size: .72rem; color: var(--fg); opacity: .35;
+  display: flex; align-items: center; gap: 6px;
+}
+.chat-meta-count { opacity: .25; }
+.mobile-sidebar-btn {
+  display: none; background: none; border: none; color: var(--fg); opacity: .5;
+  cursor: pointer; padding: 4px 8px; font-size: 18px; position: absolute; left: 0;
+}
+
+/* ── Welcome Screen ── */
+#welcome-screen {
+  position: absolute; top: 40%; left: 50%;
+  transform: translate(-50%, -50%);
+  display: flex; flex-direction: column; align-items: center;
+  text-align: center; pointer-events: none;
+  animation: welcome-enter .4s ease-out both;
+  transition: top .35s cubic-bezier(.34,1.56,.64,1), opacity .3s ease;
+}
+@keyframes welcome-enter { from { opacity: 0; transform: translate(-50%, -48%) scale(.97); } }
+.welcome-name {
+  font-size: 2rem; font-weight: 700;
+  background: linear-gradient(135deg, var(--red), var(--accent));
+  -webkit-background-clip: text; -webkit-text-fill-color: transparent; background-clip: text;
+  letter-spacing: .03em; margin-bottom: 10px; display: flex; align-items: center; gap: 10px;
+}
+.welcome-logo { width: 2rem; height: 2rem; vertical-align: -.15em; color: var(--red); }
+.welcome-sub {
+  font-size: .85rem; color: var(--fg); opacity: .5;
+  line-height: 1.5; max-width: 360px; margin-bottom: 28px;
+}
+#welcome-screen.hidden { display: none; }
+.quick-grid {
+  display: flex; flex-wrap: wrap; gap: 6px; justify-content: center; max-width: 480px;
+  pointer-events: auto;
+}
+.quick-chip {
+  padding: 8px 14px; border-radius: 20px; border: 1px solid var(--border);
+  background: var(--panel); color: var(--fg); opacity: .6; font-size: .78rem;
+  cursor: pointer; transition: all .15s; font-family: inherit;
+}
+.quick-chip:hover { opacity: 1; border-color: var(--accent); color: var(--accent);
+  transform: translateY(-1px); box-shadow: 0 2px 12px rgba(122,162,247,.1); }
+
+/* ── Chat History / Messages ── */
+.chat-history {
+  flex: 1; overflow-y: auto; overflow-x: hidden;
+  margin-bottom: 8px; min-height: 0;
+  padding-left: max(0px, calc((100% - var(--chat-max)) / 2));
+  padding-right: max(12px, calc((100% - var(--chat-max)) / 2 + 12px));
+  scrollbar-width: thin; scrollbar-color: var(--border) transparent;
+}
+.chat-history::-webkit-scrollbar { width: 5px; }
+.chat-history::-webkit-scrollbar-track { background: transparent; }
+.chat-history::-webkit-scrollbar-thumb { background: var(--border); border-radius: 3px; }
+
+.msg {
+  margin: 8px 0; position: relative; display: flex; flex-direction: column;
+  width: fit-content; max-width: 85%; min-width: 80px;
+  border-radius: 12px; padding: 10px 14px; line-height: 1.5;
+  word-wrap: break-word; animation: msg-enter .3s ease-out both;
+}
+@keyframes msg-enter { from { opacity: 0; transform: translateY(8px); } }
+
+.msg-user {
+  align-self: flex-end; margin-left: auto; margin-right: 8px;
+  background: var(--user-bubble-bg); border: 1px solid var(--bubble-border);
+  border-radius: 18px 18px 2px 18px;
+}
+.msg-ai {
+  align-self: flex-start; margin-right: auto; margin-left: 8px;
+  background: var(--ai-bubble-bg); border: 1px solid var(--bubble-border);
+  border-radius: 18px 18px 18px 2px;
+}
+.msg-error {
+  background: rgba(247,118,142,.08); border-color: rgba(247,118,142,.2);
+  color: var(--red);
+}
+
+.msg .role {
+  font-weight: 600; font-size: .72rem; margin-bottom: 5px;
+  display: flex; align-items: center; gap: 6px;
+  overflow: hidden; text-overflow: ellipsis; white-space: nowrap;
+}
+.msg-user .role { color: var(--fg); opacity: .55; }
+.msg-ai .role { color: var(--accent); opacity: .8; }
+.msg .role::before {
+  content: ''; width: 7px; height: 7px; border-radius: 50%;
+  background: var(--model-dot, rgba(198,202,245,.25)); flex-shrink: 0;
+}
+.msg-user .role::before { background: rgba(198,202,245,.35); }
+.msg .body { width: 100%; white-space: normal; word-break: break-word;
+  font-size: .92em; line-height: 1.55; }
+.msg-user .body { color: var(--fg); }
+.msg-ai .body { color: var(--fg); opacity: .88; }
+.msg .timestamp {
+  font-size: .65rem; color: var(--fg); opacity: .3;
+  margin-top: 5px; text-align: right;
+}
+.msg-user .timestamp { opacity: .45; }
+
+.typing-indicator {
+  display: flex; align-items: center; gap: 6px;
+  padding: 12px 18px; font-size: .78rem; color: var(--fg); opacity: .35; font-style: italic;
+}
+.typing-dots { display: flex; gap: 3px; }
+.typing-dots span {
+  width: 6px; height: 6px; border-radius: 50%; background: var(--fg); opacity: .3;
+  animation: typingBounce 1.4s infinite;
+}
+.typing-dots span:nth-child(2) { animation-delay: .2s; }
+.typing-dots span:nth-child(3) { animation-delay: .4s; }
+@keyframes typingBounce {
+  0%,60%,100% { transform: translateY(0); opacity: .3; }
+  30% { transform: translateY(-6px); opacity: .7; }
+}
+
+/* ── RAG Context Panel ── */
+.rag-panel {
+  max-width: var(--chat-max); margin: 0 auto 8px;
+  border: 1px solid var(--border); border-radius: 10px;
+  background: var(--panel); overflow: hidden; display: none;
+}
+.rag-panel.open { display: block; }
+.rag-header {
+  display: flex; align-items: center; justify-content: space-between;
+  padding: 8px 12px; cursor: pointer; font-size: .72rem; font-weight: 600;
+  color: var(--fg); opacity: .5; gap: 6px;
+}
+.rag-body { padding: 10px 12px; font-size: .75rem; color: var(--fg); opacity: .65;
+  line-height: 1.55; max-height: 180px; overflow-y: auto; }
+.rag-section { margin-bottom: 8px; }
+.rag-section:last-child { margin-bottom: 0; }
+.rag-section-title {
+  font-size: .65rem; font-weight: 700; text-transform: uppercase;
+  letter-spacing: .05em; color: var(--fg); opacity: .35; margin-bottom: 3px;
+}
+.rag-source {
+  padding: 4px 8px; border-radius: 5px; background: rgba(198,202,245,.04);
+  margin-bottom: 3px; font-size: .72rem;
+}
+
+/* ── Input Bar (Odysseus-style unified input) ── */
+.chat-input-bar {
+  background: var(--input-bg); border: 1px solid var(--border);
+  border-radius: 16px; padding: 10px 12px;
+  display: flex; flex-direction: column; gap: 6px;
+  max-width: 800px; margin: 0 auto; width: 100%;
+  transition: margin .3s ease, max-width .3s ease;
+}
+.chat-container.welcome-active .chat-input-bar {
+  margin-bottom: 28vh;
+}
+.chat-input-top { width: 100%; position: relative; }
+.chat-input-bar textarea {
+  width: 100%; background: transparent; border: none; outline: none;
+  resize: none; font-size: .9rem; line-height: 1.5; color: var(--fg);
+  min-height: 24px; max-height: min(60vh, 500px); padding: 0;
+  font-family: inherit; transition: height .12s ease-out;
+}
+.chat-input-bar textarea::placeholder { color: var(--fg); opacity: .3; }
+
+.model-picker-wrap {
+  position: absolute; top: 0; right: 0; z-index: 2;
+}
+.model-picker-btn {
+  background: none; border: 1px solid var(--border); border-radius: 8px;
+  color: var(--fg); opacity: .5; font-size: .72rem; cursor: pointer;
+  padding: 3px 8px; display: flex; align-items: center; gap: 4px;
+  transition: all .15s; font-family: inherit;
+}
+.model-picker-btn:hover { opacity: .8; border-color: var(--accent); color: var(--accent); }
+.model-picker-menu {
+  position: absolute; top: 100%; right: 0; margin-top: 4px;
+  background: var(--panel); border: 1px solid var(--border); border-radius: 10px;
+  min-width: 220px; max-height: 300px; overflow-y: auto;
+  z-index: 100; display: none; box-shadow: 0 8px 32px rgba(0,0,0,.3);
+}
+.model-picker-menu.open { display: block; }
+.model-picker-item {
+  padding: 8px 12px; font-size: .8rem; cursor: pointer; display: flex; align-items: center; gap: 8px;
+  color: var(--fg); opacity: .7; transition: all .1s;
+}
+.model-picker-item:hover { background: rgba(198,202,245,.07); opacity: 1; }
+.model-picker-item.selected { background: rgba(247,118,142,.1); color: var(--red); opacity: 1; }
+.model-picker-item .mp-icon { font-size: 14px; flex-shrink: 0; }
+.model-picker-item .mp-info { flex: 1; min-width: 0; }
+.model-picker-item .mp-name { font-weight: 500; }
+.model-picker-item .mp-desc { font-size: .68rem; opacity: .45; overflow: hidden; text-overflow: ellipsis; }
+
+.chat-input-bottom {
+  display: flex; justify-content: space-between; align-items: center; margin-top: 2px;
+}
+.chat-input-left { display: flex; gap: 4px; align-items: center; flex: 1; min-width: 0; }
+.chat-input-right { display: flex; gap: 8px; align-items: center; flex-shrink: 0; }
+
+.input-icon-btn {
+  background: none; border: none; color: var(--fg); opacity: .4;
+  cursor: pointer; padding: 5px; border-radius: 7px;
+  display: flex; align-items: center; justify-content: center;
+  transition: opacity .15s, background .15s;
+}
+.input-icon-btn:hover { opacity: .75; background: rgba(198,202,245,.07); }
+.input-icon-btn.active { opacity: 1; color: var(--red); background: rgba(247,118,142,.1); }
+
+.send-btn {
+  background: var(--red); color: #fff; border: none;
+  border-radius: 8px; min-width: 32px; width: 32px; height: 32px;
+  padding: 0; cursor: pointer; display: flex; align-items: center; justify-content: center;
+  transition: background .25s, transform .15s; flex-shrink: 0;
+}
+.send-btn:hover { background: color-mix(in srgb, var(--red) 80%, white); transform: scale(1.05); }
+.send-btn:disabled { opacity: .35; cursor: not-allowed; transform: none; }
+.send-btn.streaming { animation: siren-pulse 1.5s ease-in-out infinite; }
+@keyframes siren-pulse {
+  0%,100% { transform: scale(1); } 50% { transform: scale(.88); }
+}
+
+.input-hint {
+  font-size: .65rem; color: var(--fg); opacity: .2; text-align: center;
+  padding: 2px 0 0;
+}
+
+/* ── Settings Modal (Odysseus modal style) ── */
+.modal-overlay {
+  position: fixed; inset: 0; background: rgba(0,0,0,.55);
+  z-index: 200; display: none; backdrop-filter: blur(4px);
+  align-items: center; justify-content: center;
+}
+.modal-overlay.open { display: flex; }
+.modal-content {
+  background: var(--bg); border: 1px solid var(--border);
+  border-radius: 14px; width: 480px; max-width: 92vw; max-height: 80vh;
+  display: flex; flex-direction: column; overflow: hidden;
+  box-shadow: 0 16px 64px rgba(0,0,0,.4);
+  animation: modal-in .2s ease-out;
+}
+@keyframes modal-in { from { opacity: 0; transform: scale(.95) translateY(10px); } }
+.modal-header {
+  display: flex; align-items: center; justify-content: space-between;
+  padding: 14px 18px; border-bottom: 1px solid var(--border); flex-shrink: 0;
+}
+.modal-header h4 { font-size: .88rem; font-weight: 600; display: flex; align-items: center; gap: 8px; }
+.close-btn {
+  background: none; border: none; color: var(--fg); opacity: .4;
+  cursor: pointer; font-size: 16px; padding: 4px; transition: opacity .12s;
+}
+.close-btn:hover { opacity: .8; }
+.modal-body { flex: 1; overflow-y: auto; padding: 18px; }
+.modal-footer {
+  padding: 12px 18px; border-top: 1px solid var(--border);
+  display: flex; gap: 8px; align-items: center; flex-shrink: 0;
+}
+
+.form-group { margin-bottom: 14px; }
+.form-group label {
+  display: block; font-size: .7rem; font-weight: 600; text-transform: uppercase;
+  letter-spacing: .05em; color: var(--fg); opacity: .4; margin-bottom: 5px;
+}
+.form-group input, .form-group select {
+  width: 100%; padding: 8px 10px; border: 1px solid var(--border);
+  border-radius: 7px; background: var(--panel); color: var(--fg);
+  font-size: .82rem; font-family: inherit; outline: none; transition: border-color .15s;
+}
+.form-group input:focus, .form-group select:focus { border-color: var(--accent); }
+.form-group input::placeholder { color: var(--fg); opacity: .25; }
+
+.btn {
+  padding: 7px 14px; border-radius: 7px; font-size: .78rem; cursor: pointer;
+  font-family: inherit; transition: all .15s; border: 1px solid transparent;
+}
+.btn-primary { background: var(--red); color: #fff; }
+.btn-primary:hover { background: color-mix(in srgb, var(--red) 80%, white); }
+.btn-ghost { background: transparent; color: var(--fg); opacity: .6; border-color: var(--border); }
+.btn-ghost:hover { opacity: 1; border-color: var(--fg); }
+.btn-danger { color: var(--red); border-color: rgba(247,118,142,.25); background: transparent; }
+.btn-danger:hover { background: rgba(247,118,142,.08); }
+
+/* ── Manage Provider Cards ── */
+.manage-card {
+  display: flex; align-items: center; gap: 12px;
+  padding: 10px 12px; border-radius: 10px;
+  border: 1px solid var(--border); background: var(--panel);
+  margin-bottom: 6px; transition: border-color .15s;
+}
+.manage-card:hover { border-color: rgba(198,202,245,.15); }
+.manage-card.active-card { border-color: rgba(247,118,142,.3); background: rgba(247,118,142,.04); }
+.manage-card-icon {
+  width: 34px; height: 34px; border-radius: 8px;
+  background: rgba(198,202,245,.06); display: flex; align-items: center;
+  justify-content: center; font-size: 16px; flex-shrink: 0;
+}
+.manage-card-info { flex: 1; min-width: 0; }
+.manage-card-name { font-size: .85rem; font-weight: 600; color: var(--fg); }
+.manage-card-detail { font-size: .7rem; color: var(--fg); opacity: .4; margin-top: 2px;
+  overflow: hidden; text-overflow: ellipsis; white-space: nowrap; }
+.manage-card-badge {
+  font-size: .6rem; padding: 2px 6px; border-radius: 4px;
+  background: rgba(122,162,247,.1); color: var(--accent); font-weight: 600;
+  margin-left: 6px; vertical-align: middle;
+}
+.manage-card-actions { display: flex; gap: 4px; flex-shrink: 0; }
+.manage-action-btn {
+  width: 28px; height: 28px; border: none; border-radius: 6px;
+  background: transparent; color: var(--fg); opacity: .35; font-size: 13px;
+  cursor: pointer; display: flex; align-items: center; justify-content: center;
+  transition: all .12s;
+}
+.manage-action-btn:hover { opacity: .8; background: rgba(198,202,245,.08); }
+.manage-action-btn.ma-del:hover { color: var(--red); opacity: 1; }
+.manage-action-btn.ma-select:hover { color: var(--green); opacity: 1; }
+
+/* ── Mobile ── */
+@media(max-width: 768px) {
+  .sidebar {
+    position: fixed; left: 0; top: 38px; bottom: 0; z-index: 150;
+    transform: translateX(-100%); box-shadow: 4px 0 30px rgba(0,0,0,.4);
+    width: 280px; min-width: 280px;
+  }
+  .sidebar.open { transform: translateX(0); }
+  .mobile-sidebar-btn { display: flex; }
+  .chat-container { padding: 0 12px; }
+  .welcome-name { font-size: 1.5rem; }
+  .quick-grid { flex-direction: column; }
+  .quick-chip { text-align: center; }
+  .chat-container.welcome-active .chat-input-bar { margin-bottom: 0; }
+  .modal-content { width: 95vw; }
+}
+@media(min-width: 769px) {
+  .sidebar-backdrop { display: none !important; }
+}
+.sidebar-backdrop {
+  position: fixed; inset: 0; background: rgba(0,0,0,.4);
+  z-index: 140; display: none;
+}
+.sidebar-backdrop.open { display: block; }
+
+/* ── Session History ── */
+.session-item { position: relative; }
+.session-item .sess-del {
+  display: none; position: absolute; right: 6px; top: 50%; transform: translateY(-50%);
+  width: 20px; height: 20px; border: none; border-radius: 4px;
+  background: transparent; color: var(--fg); opacity: .3; font-size: 11px;
+  cursor: pointer; display: none; align-items: center; justify-content: center;
+  transition: all .12s;
+}
+.session-item:hover .sess-del { display: flex; }
+.session-item .sess-del:hover { color: var(--red); opacity: 1; background: rgba(247,118,142,.08); }
+.session-item .sess-preview { font-size: .7rem; opacity: .4; overflow: hidden; text-overflow: ellipsis; white-space: nowrap; max-width: 160px; }
+
+/* ── Mode Toggle ── */
+.mode-toggle { display: flex; border: 1px solid var(--border); border-radius: 7px; overflow: hidden; }
+.mode-toggle-btn {
+  padding: 4px 10px; border: none; background: transparent; color: var(--fg); opacity: .4;
+  font-size: .7rem; cursor: pointer; font-family: inherit; font-weight: 500;
+  transition: all .15s;
+}
+.mode-toggle-btn:hover { opacity: .7; }
+.mode-toggle-btn.active { opacity: 1; color: #fff; }
+.mode-toggle-btn.active[data-mode="chat"] { background: var(--accent); }
+.mode-toggle-btn.active[data-mode="code"] { background: var(--green); color: #111; }
+.mode-toggle-btn.active[data-mode="brain"] { background: var(--accent-secondary); }
+
+/* ── RAG Source Toggles ── */
+.rag-toggles { display: flex; gap: 6px; padding: 8px 10px; }
+.rag-toggle-chip {
+  display: flex; align-items: center; gap: 4px; padding: 4px 8px;
+  border-radius: 6px; border: 1px solid var(--border); background: transparent;
+  color: var(--fg); opacity: .45; font-size: .7rem; cursor: pointer;
+  font-family: inherit; transition: all .15s;
+}
+.rag-toggle-chip:hover { opacity: .7; }
+.rag-toggle-chip.on { opacity: 1; border-color: var(--accent); background: rgba(122,162,247,.08); color: var(--accent); }
+.rag-toggle-chip .dot { width: 6px; height: 6px; border-radius: 50%; background: currentColor; flex-shrink: 0; }
+
+/* ── Message Action Buttons ── */
+.msg-actions {
+  display: flex; gap: 2px; margin-top: 6px; opacity: 0; transition: opacity .15s;
+}
+.msg:hover .msg-actions { opacity: 1; }
+.msg-action {
+  background: none; border: none; color: var(--fg); opacity: .35;
+  cursor: pointer; padding: 3px 6px; border-radius: 4px; font-size: .68rem;
+  font-family: inherit; display: flex; align-items: center; gap: 3px;
+  transition: all .12s;
+}
+.msg-action:hover { opacity: .8; background: rgba(198,202,245,.07); }
+.msg-action.ma-save:hover { color: var(--green); opacity: 1; }
+.msg-action.ma-redo:hover { color: var(--accent); opacity: 1; }
+.msg-action.ma-copy:hover { color: var(--fg); opacity: 1; }
+.msg-action svg { width: 12px; height: 12px; }
+
+/* ── Save to Wiki Modal ── */
+.save-toast {
+  position: fixed; bottom: 24px; left: 50%; transform: translateX(-50%);
+  padding: 10px 20px; border-radius: 10px; background: var(--green); color: #111;
+  font-size: .82rem; font-weight: 600; z-index: 999; opacity: 0;
+  transition: opacity .3s, transform .3s; pointer-events: none;
+}
+.save-toast.show { opacity: 1; transform: translateX(-50%) translateY(-8px); }
+</style>
+</head>
+<body>
+
+<!-- Ecosystem Navigation -->
+<nav class="eco-nav">
+  <a class="eco-link brand" href="/zportal">Z.AI</a>
+  <a class="eco-link" href="/zportal/wiki">
+    <svg viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" width="13" height="13"><path d="M4 19.5A2.5 2.5 0 016.5 17H20"/><path d="M6.5 2H20v20H6.5A2.5 2.5 0 014 19.5v-15A2.5 2.5 0 016.5 2z"/></svg>Wiki
+  </a>
+  <a class="eco-link active" href="/zportal/chat">
+    <svg viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" width="13" height="13"><path d="M21 15a2 2 0 01-2 2H7l-4 4V5a2 2 0 012-2h14a2 2 0 012 2z"/></svg>Chat
+  </a>
+  <a class="eco-link" href="/zportal/helpdesk/">
+    <svg viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" width="13" height="13"><path d="M21 15a2 2 0 01-2 2H7l-4 4V5a2 2 0 012-2h14a2 2 0 012 2z"/></svg>Helpdesk
+  </a>
+</nav>
+
+<div class="app-shell">
+
+<!-- ── Sidebar ── -->
+<aside class="sidebar" id="sidebar">
+  <div class="sidebar-header">
+    <button class="sidebar-toggle-btn" id="sidebar-toggle" title="Toggle sidebar">
+      <svg width="16" height="16" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2.5" stroke-linecap="round"><line x1="3" y1="6" x2="21" y2="6"/><line x1="3" y1="12" x2="21" y2="12"/><line x1="3" y1="18" x2="21" y2="18"/></svg>
+    </button>
+    <div class="sidebar-brand" id="sidebar-brand" title="New chat">
+      <div class="sidebar-brand-icon">&#x1F9E0;</div>
+      <span class="sidebar-brand-title">Z.ai Chat</span>
+    </div>
+  </div>
+
+  <div class="sidebar-inner">
+    <!-- New Chat -->
+    <div class="list-item" id="sidebar-new-chat" title="New conversation">
+      <svg width="14" height="14" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2.5" stroke-linecap="round"><line x1="12" y1="5" x2="12" y2="19"/><line x1="5" y1="12" x2="19" y2="12"/></svg>
+      <span class="grow">New Chat</span>
+    </div>
+
+    <!-- Session History -->
+    <div class="section" id="history-section">
+      <div class="section-header-flex">
+        <span class="section-title">
+          <svg class="section-icon" width="13" height="13" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round"><circle cx="12" cy="12" r="10"/><polyline points="12 6 12 12 16 14"/></svg>
+          History
+        </span>
+      </div>
+      <div id="session-list"></div>
+    </div>
+
+    <!-- Providers Section -->
+    <div class="section" id="providers-section">
+      <div class="section-header-flex">
+        <span class="section-title">
+          <svg class="section-icon" width="13" height="13" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round"><path d="M21 15a2 2 0 01-2 2H7l-4 4V5a2 2 0 012-2h14a2 2 0 012 2z"/></svg>
+          Providers
+        </span>
+      </div>
+      <div id="provider-list"></div>
+    </div>
+
+    <!-- Tools Section -->
+    <div class="section" id="tools-section">
+      <div class="section-header-flex">
+        <span class="section-title">
+          <svg class="section-icon" width="12" height="12" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><path d="M14.7 6.3a1 1 0 000 1.4l1.6 1.6a1 1 0 001.4 0l3.77-3.77a6 6 0 01-7.94 7.94l-6.91 6.91a2.12 2.12 0 01-3-3l6.91-6.91a6 6 0 017.94-7.94l-3.76 3.76z"/></svg>
+          Tools
+        </span>
+      </div>
+      <div class="list-item" id="tool-settings-btn" title="Provider Settings">
+        <svg width="14" height="14" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" style="flex-shrink:0;opacity:.5;"><circle cx="12" cy="12" r="3"/><path d="M19.4 15a1.65 1.65 0 00.33 1.82l.06.06a2 2 0 01-2.83 2.83l-.06-.06a1.65 1.65 0 00-1.82-.33 1.65 1.65 0 00-1 1.51V21a2 2 0 01-4 0v-.09A1.65 1.65 0 009 19.4a1.65 1.65 0 00-1.82.33l-.06.06a2 2 0 01-2.83-2.83l.06-.06A1.65 1.65 0 004.68 15a1.65 1.65 0 00-1.51-1H3a2 2 0 010-4h.09A1.65 1.65 0 004.6 9a1.65 1.65 0 00-.33-1.82l-.06-.06a2 2 0 012.83-2.83l.06.06A1.65 1.65 0 009 4.68a1.65 1.65 0 011-1.51V3a2 2 0 014 0v.09a1.65 1.65 0 001 1.51 1.65 1.65 0 001.82-.33l.06-.06a2 2 0 012.83 2.83l-.06.06A1.65 1.65 0 0019.4 9a1.65 1.65 0 001.51 1H21a2 2 0 010 4h-.09a1.65 1.65 0 00-1.51 1z"/></svg>
+        <span class="grow">Settings</span>
+      </div>
+      <div class="list-item" id="tool-rag-btn" title="RAG Knowledge Sources">
+        <svg width="14" height="14" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" style="flex-shrink:0;opacity:.5;"><ellipse cx="12" cy="5" rx="9" ry="3"/><path d="M21 12c0 1.66-4 3-9 3s-9-1.34-9-3"/><path d="M3 5v14c0 1.66 4 3 9 3s9-1.34 9-3V5"/></svg>
+        <span class="grow">Knowledge Base</span>
+        <span id="rag-status-dot" style="display:none;width:7px;height:7px;border-radius:50%;background:var(--green);flex-shrink:0;"></span>
+      </div>
+      <div class="rag-toggles" id="rag-toggles">
+        <button class="rag-toggle-chip on" id="rag-wiki-toggle" title="Toggle Wiki KB search"><span class="dot"></span>Wiki KB</button>
+        <button class="rag-toggle-chip on" id="rag-vector-toggle" title="Toggle VectorDB search"><span class="dot"></span>VectorDB</button>
+      </div>
+    </div>
+  </div>
+
+  <div class="sidebar-footer">
+    <button class="new-provider-btn" id="btn-add-provider">+ Add Custom Provider</button>
+  </div>
+</aside>
+
+<!-- Mobile sidebar backdrop -->
+<div class="sidebar-backdrop" id="sidebar-backdrop"></div>
+
+<!-- ── Main Chat Area ── -->
+<main class="chat-container welcome-active" id="chat-container">
+
+  <div class="chat-top-bar">
+    <button class="mobile-sidebar-btn" id="mobile-sidebar-btn">
+      <svg width="18" height="18" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2.5" stroke-linecap="round"><line x1="3" y1="6" x2="21" y2="6"/><line x1="3" y1="12" x2="21" y2="12"/><line x1="3" y1="18" x2="21" y2="18"/></svg>
+    </button>
+    <div class="chat-meta-overlay">
+      <span id="current-meta">Z.ai Wiki Assistant</span>
+      <span class="chat-meta-count" id="msg-count"></span>
+    </div>
+  </div>
+
+  <!-- Welcome Screen -->
+  <div id="welcome-screen">
+    <div class="welcome-name">
+      <svg class="welcome-logo" viewBox="0 0 32 32"><path d="M16 4L16 22L6 22Z" fill="currentColor"/><path d="M16 8L16 22L24 22Z" fill="currentColor" opacity=".6"/><path d="M4 24Q10 20 16 24Q22 28 28 24" stroke="currentColor" stroke-width="2.5" fill="none" stroke-linecap="round"/></svg>
+      Z.ai Chat
+    </div>
+    <div class="welcome-sub">Ask about Z.ai wiki knowledge, community discussions, API docs &mdash; powered by VectorDB RAG with multi-provider AI.</div>
+    <div class="quick-grid" id="quick-actions">
+      <button class="quick-chip" data-msg="What is the Z.ai Coding Plan?">Coding Plan</button>
+      <button class="quick-chip" data-msg="How do I become a Z.ai Ambassador?">Ambassador</button>
+      <button class="quick-chip" data-msg="What are common issues users face?">Common Issues</button>
+      <button class="quick-chip" data-msg="Explain the GLM model family">GLM Models</button>
+      <button class="quick-chip" data-msg="What community discussions are trending?">Trending</button>
+      <button class="quick-chip" data-msg="Help me find documentation about API usage">API Docs</button>
+    </div>
+  </div>
+
+  <!-- Messages -->
+  <div class="chat-history" id="chat-history"></div>
+
+  <!-- Typing Indicator -->
+  <div class="typing-indicator" id="typing-indicator" style="display:none">
+    <div class="typing-dots"><span></span><span></span><span></span></div>
+    thinking...
+  </div>
+
+  <!-- RAG Panel -->
+  <div class="rag-panel" id="rag-panel">
+    <div class="rag-header" id="rag-header">
+      <span>&#x1F50D; Knowledge Sources Used</span>
+      <span id="rag-chevron">&#9650;</span>
+    </div>
+    <div class="rag-body" id="rag-body"></div>
+  </div>
+
+  <!-- Input Bar -->
+  <div class="chat-input-bar" id="chat-input-bar">
+    <div class="chat-input-top">
+      <textarea id="message" placeholder="Message Z.ai Chat..." rows="1" autofocus></textarea>
+      <div class="model-picker-wrap" id="model-picker-wrap">
+        <button class="model-picker-btn" id="model-picker-btn" title="Switch Provider">
+          <span id="model-picker-label">Select...</span>
+          <svg width="10" height="10" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="3" stroke-linecap="round"><polyline points="6 15 12 9 18 15"/></svg>
+        </button>
+        <div class="model-picker-menu" id="model-picker-menu"></div>
+      </div>
+    </div>
+    <div class="chat-input-bottom">
+      <div class="chat-input-left">
+        <button class="input-icon-btn" id="rag-toggle-btn" title="Toggle RAG context">
+          <svg width="15" height="15" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2"><ellipse cx="12" cy="5" rx="9" ry="3"/><path d="M21 12c0 1.66-4 3-9 3s-9-1.34-9-3"/><path d="M3 5v14c0 1.66 4 3 9 3s9-1.34 9-3V5"/></svg>
+        </button>
+      </div>
+      <div class="chat-input-right">
+        <div class="mode-toggle" id="mode-toggle">
+          <button class="mode-toggle-btn active" data-mode="chat" title="Chat mode">Chat</button>
+          <button class="mode-toggle-btn" data-mode="code" title="Coding mode">Code</button>
+          <button class="mode-toggle-btn" data-mode="brain" title="Brainstorm mode">Brain</button>
+        </div>
+        <button class="send-btn" id="send-btn" title="Send message">
+          <svg width="16" height="16" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2.5" stroke-linecap="round" stroke-linejoin="round"><line x1="22" y1="2" x2="11" y2="13"/><polygon points="22 2 15 22 11 13 2 9 22 2"/></svg>
+        </button>
+      </div>
+    </div>
+    <div class="input-hint">Press Enter to send &middot; Shift+Enter for newline &middot; RAG auto-injects Wiki KB + VectorDB context</div>
+  </div>
+
+</main>
+</div><!-- /app-shell -->
+
+<!-- Manage Providers Modal -->
+<div class="modal-overlay" id="manage-modal">
+  <div class="modal-content" style="width:540px">
+    <div class="modal-header">
+      <h4>
+        <svg width="14" height="14" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><path d="M21 15a2 2 0 01-2 2H7l-4 4V5a2 2 0 012-2h14a2 2 0 012 2z"/></svg>
+        Manage Providers
+      </h4>
+      <button class="close-btn" id="manage-close">&times;</button>
+    </div>
+    <div class="modal-body" style="padding:10px 14px;">
+      <div id="manage-provider-list"></div>
+    </div>
+    <div class="modal-footer">
+      <button class="btn btn-primary" id="manage-add-btn">+ Add Provider</button>
+      <div style="flex:1"></div>
+      <button class="btn btn-ghost" id="manage-done">Done</button>
+    </div>
+  </div>
+</div>
+
+<!-- Settings (Add/Edit) Modal -->
+<div class="modal-overlay" id="settings-modal">
+  <div class="modal-content">
+    <div class="modal-header">
+      <h4>
+        <svg width="14" height="14" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="3"/><path d="M19.4 15a1.65 1.65 0 00.33 1.82l.06.06a2 2 0 01-2.83 2.83l-.06-.06a1.65 1.65 0 00-1.82-.33 1.65 1.65 0 00-1 1.51V21a2 2 0 01-4 0v-.09A1.65 1.65 0 009 19.4a1.65 1.65 0 00-1.82.33l-.06.06a2 2 0 01-2.83-2.83l.06-.06A1.65 1.65 0 004.68 15a1.65 1.65 0 00-1.51-1H3a2 2 0 010-4h.09A1.65 1.65 0 004.6 9a1.65 1.65 0 00-.33-1.82l-.06-.06a2 2 0 012.83-2.83l.06.06A1.65 1.65 0 009 4.68a1.65 1.65 0 011-1.51V3a2 2 0 014 0v.09a1.65 1.65 0 001 1.51 1.65 1.65 0 001.82-.33l.06-.06a2 2 0 012.83 2.83l-.06.06A1.65 1.65 0 0019.4 9a1.65 1.65 0 001.51 1H21a2 2 0 010 4h-.09a1.65 1.65 0 00-1.51 1z"/></svg>
+        <span id="settings-title">Add Provider</span>
+      </h4>
+      <button class="close-btn" id="settings-close">&times;</button>
+    </div>
+    <div class="modal-body">
+      <div class="form-group">
+        <label>Provider Name *</label>
+        <input id="set-name" placeholder="My OpenAI Instance">
+      </div>
+      <div class="form-group">
+        <label>API Base URL *</label>
+        <input id="set-url" placeholder="https://api.openai.com/v1">
+      </div>
+      <div class="form-group">
+        <label>Model *</label>
+        <input id="set-model" placeholder="gpt-4o-mini">
+      </div>
+      <div class="form-group">
+        <label>API Key (optional)</label>
+        <input id="set-key" type="password" placeholder="sk-...">
+      </div>
+      <div class="form-group">
+        <label>Format</label>
+        <select id="set-format">
+          <option value="openai">OpenAI Compatible</option>
+          <option value="anthropic">Anthropic</option>
+          <option value="ollama">Ollama</option>
+          <option value="openrouter">OpenRouter</option>
+        </select>
+      </div>
+    </div>
+    <div class="modal-footer">
+      <button class="btn btn-danger" id="settings-delete" style="display:none">Delete</button>
+      <div style="flex:1"></div>
+      <button class="btn btn-ghost" id="settings-cancel">Cancel</button>
+      <button class="btn btn-primary" id="settings-save">Save</button>
+    </div>
+  </div>
+</div>
+
+<script>
+(function(){
+'use strict';
+
+const API = '/zportal/wiki/api/chat/';
+const $ = id => document.getElementById(id);
+
+let providers = [];
+let activeProvider = null;
+let history = [];
+let streaming = false;
+let editingProvider = null;
+let ragEnabled = true;
+let ragWikiEnabled = true;
+let ragVectorEnabled = true;
+let chatMode = 'chat';
+
+// ── Session History (localStorage) ──
+const STORE_KEY = 'zaichat_sessions';
+const MAX_SESSIONS = 50;
+let currentSessionId = null;
+
+function loadSessions(){
+  try{ return JSON.parse(localStorage.getItem(STORE_KEY)||'[]'); }catch(e){ return []; }
+}
+function saveSessions(sessions){
+  localStorage.setItem(STORE_KEY, JSON.stringify(sessions));
+}
+function getSessionTitle(msg){
+  if(!msg) return 'Empty chat';
+  return msg.length > 40 ? msg.slice(0,40)+'...' : msg;
+}
+function currentSession(){
+  if(!currentSessionId) return null;
+  return loadSessions().find(s=>s.id===currentSessionId)||null;
+}
+function saveCurrentSession(){
+  if(!currentSessionId) return;
+  const sessions = loadSessions();
+  const idx = sessions.findIndex(s=>s.id===currentSessionId);
+  const data = {
+    id: currentSessionId,
+    title: getSessionTitle(history.length?history[0].content:''),
+    history: history,
+    provider: activeProvider?activeProvider.id:null,
+    mode: chatMode,
+    ragWiki: ragWikiEnabled,
+    ragVector: ragVectorEnabled,
+    updated: Date.now(),
+  };
+  if(idx>=0) sessions[idx]=data; else sessions.unshift(data);
+  // Trim old sessions
+  if(sessions.length>MAX_SESSIONS) sessions.length=MAX_SESSIONS;
+  saveSessions(sessions);
+  renderSessions();
+}
+function loadSession(id){
+  const sessions = loadSessions();
+  const sess = sessions.find(s=>s.id===id);
+  if(!sess) return;
+  currentSessionId = sess.id;
+  history = sess.history||[];
+  chatMode = sess.mode||'chat';
+  ragWikiEnabled = sess.ragWiki!==false;
+  ragVectorEnabled = sess.ragVector!==false;
+
+  // Restore mode toggle UI
+  document.querySelectorAll('.mode-toggle-btn').forEach(b=>{
+    b.classList.toggle('active', b.getAttribute('data-mode')===chatMode);
+  });
+  // Restore RAG toggle chips
+  $('rag-wiki-toggle').classList.toggle('on', ragWikiEnabled);
+  $('rag-vector-toggle').classList.toggle('on', ragVectorEnabled);
+
+  // Restore provider
+  if(sess.provider){
+    const p = providers.find(x=>x.id===sess.provider);
+    if(p) selectProvider(p);
+  }
+
+  // Render messages from history
+  const area=$('chat-history');
+  area.innerHTML='';
+  if(history.length){
+    hideWelcome();
+    history.forEach(m=>{
+      addMessage(m.content, m.role, m.role==='assistant'?{provider:activeProvider}:null);
+    });
+  } else {
+    showWelcome();
+  }
+  updateMsgCount();
+  renderSessions();
+}
+function deleteSession(id){
+  const sessions = loadSessions().filter(s=>s.id!==id);
+  saveSessions(sessions);
+  if(currentSessionId===id){
+    currentSessionId=null;
+    history=[];
+    $('chat-history').innerHTML='';
+    showWelcome();
+    updateMsgCount();
+  }
+  renderSessions();
+}
+function renderSessions(){
+  const list=$('session-list');
+  const sessions=loadSessions();
+  list.innerHTML='';
+  if(!sessions.length){
+    list.innerHTML='<div style="padding:4px 10px;font-size:.7rem;opacity:.25;">No sessions yet</div>';
+    return;
+  }
+  sessions.forEach(s=>{
+    const div=document.createElement('div');
+    div.className='list-item session-item'+(s.id===currentSessionId?' active':'');
+    const timeStr=new Date(s.updated).toLocaleDateString([],{month:'short',day:'numeric'})+' '+new Date(s.updated).toLocaleTimeString([],{hour:'2-digit',minute:'2-digit'});
+    div.innerHTML=
+      '<svg width="14" height="14" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" style="flex-shrink:0;opacity:.4;"><path d="M21 15a2 2 0 01-2 2H7l-4 4V5a2 2 0 012-2h14a2 2 0 012 2z"/></svg>'+
+      '<div style="flex:1;min-width:0;">'+
+        '<div class="grow" style="overflow:hidden;text-overflow:ellipsis;white-space:nowrap;">'+esc(s.title)+'</div>'+
+        '<div class="sess-preview">'+esc(timeStr)+' &middot; '+(s.history?s.history.length:0)+' msgs</div>'+
+      '</div>'+
+      '<button class="sess-del" title="Delete session">&times;</button>';
+    div.addEventListener('click', function(e){
+      if(e.target.closest('.sess-del')){ e.stopPropagation(); deleteSession(s.id); return; }
+      loadSession(s.id);
+      closeSidebarMobile();
+    });
+    list.appendChild(div);
+  });
+}
+
+function esc(s){ if(!s) return ''; const d=document.createElement('div'); d.textContent=s; return d.innerHTML; }
+function icon(p){ return p.icon || '\u2728'; }
+function renderMd(text){
+  if(!text) return '';
+  // First escape HTML, then apply markdown formatting
+  let h = esc(text);
+  // Code blocks (```...```)
+  h = h.replace(/```(\w*)\n?([\s\S]*?)```/g, function(_, lang, code){
+    return '<pre style="background:rgba(0,0,0,.3);border-radius:8px;padding:10px 12px;margin:6px 0;overflow-x:auto;font-size:.82em;line-height:1.4;"><code>'+code.replace(/^\n/,'')+'</code></pre>';
+  });
+  // Inline code
+  h = h.replace(/`([^`]+)`/g, '<code style="background:rgba(198,202,245,.08);padding:1px 5px;border-radius:4px;font-size:.88em;">$1</code>');
+  // Bold
+  h = h.replace(/\*\*(.+?)\*\*/g, '<strong>$1</strong>');
+  // Italic
+  h = h.replace(/(?<!\*)\*(?!\*)(.+?)(?<!\*)\*(?!\*)/g, '<em>$1</em>');
+  // Unordered lists
+  h = h.replace(/^- (.+)$/gm, '<li style="margin-left:16px;list-style:disc;">$1</li>');
+  h = h.replace(/(<li[^>]*>.*<\/li>\n?)+/g, '<ul style="margin:4px 0;padding-left:8px;">$&</ul>');
+  // Ordered lists
+  h = h.replace(/^\d+\. (.+)$/gm, '<li style="margin-left:16px;list-style:decimal;">$1</li>');
+  // Line breaks
+  h = h.replace(/\n/g, '<br>');
+  // Clean up <br> inside <pre>
+  h = h.replace(/<pre([^>]*)>([\s\S]*?)<\/pre>/g, function(m, attrs, code){
+    return '<pre'+attrs+'>'+code.replace(/<br>/g,'\n')+'</pre>';
+  });
+  return h;
+}
+
+// ── Sidebar Toggle ──
+function toggleSidebar(){ const sb=$('sidebar'); sb.classList.toggle('collapsed'); }
+function openSidebarMobile(){ $('sidebar').classList.add('open'); $('sidebar-backdrop').classList.add('close'); }
+function closeSidebarMobile(){ $('sidebar').classList.remove('open'); $('sidebar-backdrop').classList.remove('close'); }
+$('sidebar-toggle').addEventListener('click', toggleSidebar);
+$('mobile-sidebar-btn').addEventListener('click', openSidebarMobile);
+$('sidebar-backdrop').addEventListener('click', closeSidebarMobile);
+
+// New Chat
+$('sidebar-new-chat').addEventListener('click', function(){
+  currentSessionId = 'sess-'+Date.now();
+  history=[];
+  $('chat-history').innerHTML='';
+  $('rag-panel').classList.remove('open');
+  $('rag-body').innerHTML='';
+  $('chat-container').classList.add('welcome-active');
+  updateMsgCount();
+  renderSessions();
+});
+$('sidebar-brand').addEventListener('click', function(){
+  $('sidebar-new-chat').click();
+});
+
+// ── Render Providers (Sidebar List) ──
+function renderProviders(filter){
+  const list=$('provider-list');
+  list.innerHTML='';
+  const q=(filter||'').toLowerCase();
+  providers.filter(p => p.name.toLowerCase().includes(q)||(p.description||'').toLowerCase().includes(q)).forEach(p=>{
+    const div=document.createElement('div');
+    div.className='list-item provider-item'+(activeProvider&&activeProvider.id===p.id?' active':'');
+    const isCustom=p.id&&p.id.startsWith('custom-');
+    const hasKey=!!p.api_key;
+    div.innerHTML=
+      '<span class="mp-icon">'+esc(icon(p))+'</span>'+
+      '<span class="grow">'+esc(p.name)+'</span>'+
+      '<span class="p-check">&#10003;</span>'+
+      '<div class="p-actions">'+
+        '<button class="p-action-btn p-edit" title="'+(isCustom?'Edit':hasKey?'Edit token':'Add token')+'">'+(hasKey?'&#9998;':'&#128273;')+'</button>'+
+        (isCustom?'<button class="p-action-btn p-del" title="Delete">&#128465;</button>':'')+
+      '</div>';
+    div.addEventListener('click', function(e){
+      if(e.target.closest('.p-edit')){ e.stopPropagation(); openSettings(p); return; }
+      if(e.target.closest('.p-del')){ e.stopPropagation(); deleteProvider(p); return; }
+      selectProvider(p);
+    });
+    list.appendChild(div);
+  });
+}
+
+// ── Model Picker (in Input Bar) ──
+function renderModelPicker(){
+  const menu=$('model-picker-menu');
+  menu.innerHTML='';
+  providers.forEach(p=>{
+    const item=document.createElement('div');
+    item.className='model-picker-item'+(activeProvider&&activeProvider.id===p.id?' selected':'');
+    item.innerHTML=
+      '<span class="mp-icon">'+esc(icon(p))+'</span>'+
+      '<div class="mp-info"><div class="mp-name">'+esc(p.name)+'</div><div class="mp-desc">'+esc(p.description||p.model||'')+'</div></div>';
+    item.addEventListener('click', function(e){ e.stopPropagation(); selectProvider(p); menu.classList.remove('open'); });
+    menu.appendChild(item);
+  });
+  updateModelPickerLabel();
+}
+
+function updateModelPickerLabel(){
+  const label=$('model-picker-label');
+  if(activeProvider) label.textContent=icon(activeProvider)+' '+activeProvider.name;
+  else label.textContent='Select...';
+}
+
+function toggleModelPickerMenu(){
+  $('model-picker-menu').classList.toggle('open');
+}
+document.addEventListener('click', function(e){
+  if(!e.target.closest('#model-picker-wrap')) $('model-picker-menu').classList.remove('open');
+});
+$('model-picker-btn').addEventListener('click', function(e){ e.stopPropagation(); toggleModelPickerMenu(); });
+
+function selectProvider(p){
+  activeProvider=p;
+  renderProviders();
+  renderModelPicker();
+  updateMeta();
+  closeSidebarMobile();
+}
+
+function updateMeta(){
+  const meta=$('current-meta');
+  if(activeProvider) meta.textContent=icon(activeProvider)+' '+activeProvider.name+' \u2014 Z.ai Wiki';
+  else meta.textContent='Z.ai Wiki Assistant';
+}
+
+// ── Welcome Screen ──
+function showWelcome(){ $('chat-container').classList.add('welcome-active'); $('welcome-screen').classList.remove('hidden'); }
+function hideWelcome(){ $('chat-container').classList.remove('welcome-active'); $('welcome-screen').classList.add('hidden'); }
+
+// ── Message Rendering (Odysseus bubble style) ──
+function addMessage(content, role, meta){
+  hideWelcome();
+  const area=$('chat-history');
+  const div=document.createElement('div');
+
+  const isUser=role==='user';
+  const isError=meta&&meta.error;
+  let cls='msg '+(isUser?'msg-user':(isError?'msg-error':'msg-ai'));
+
+  let roleHtml='';
+  if(isUser) roleHtml='<div class="role">You</div>';
+  else{
+    if(meta&&meta.provider)
+      roleHtml='<div class="role has-logo"><span style="display:inline-flex;align-items:center;gap:4px;">'+esc(icon(meta.provider))+' '+esc(meta.provider.name)+'</span></div>';
+    else
+      roleHtml='<div class="role">Z.ai Assistant</div>';
+  }
+
+  const bodyContent=isError?content:renderMd(content);
+
+  // Action buttons for AI messages
+  let actionsHtml='';
+  if(!isUser && !isError){
+    const lastUserMsg=(history.length>=1&&history[history.length-1].role==='user')?history[history.length-1].content:'';
+    actionsHtml='<div class="msg-actions">'+
+      '<button class="msg-action ma-copy" title="Copy"><svg viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round"><rect x="9" y="9" width="13" height="13" rx="2"/><path d="M5 15H4a2 2 0 01-2-2V4a2 2 0 012-2h9a2 2 0 012 2v1"/></svg>Copy</button>'+
+      '<button class="msg-action ma-redo" title="Regenerate"><svg viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round"><polyline points="23 4 23 10 17 10"/><path d="M20.49 15a9 9 0 11-2.12-9.36L23 10"/></svg>Redo</button>'+
+      '<button class="msg-action ma-save" title="Save to Wiki KB"><svg viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round"><path d="M19 21H5a2 2 0 01-2-2V5a2 2 0 012-2h11l5 5v11a2 2 0 01-2 2z"/><polyline points="17 21 17 13 7 13 7 21"/><polyline points="7 3 7 8 15 8"/></svg>Save</button>'+
+    '</div>';
+    div.setAttribute('data-user-msg', lastUserMsg);
+  }
+
+  div.className=cls;
+  div.innerHTML=roleHtml+'<div class="body">'+bodyContent+'</div>'+actionsHtml+'<div class="timestamp">'+new Date().toLocaleTimeString([],{hour:'2-digit',minute:'2-digit'})+'</div>';
+
+  // Wire action buttons
+  if(!isUser && !isError){
+    const bodyEl=div.querySelector('.body');
+    const copyBtn=div.querySelector('.ma-copy');
+    const redoBtn=div.querySelector('.ma-redo');
+    const saveBtn=div.querySelector('.ma-save');
+    if(copyBtn) copyBtn.addEventListener('click', function(){
+      copyMsg(bodyEl.textContent);
+    });
+    if(redoBtn) redoBtn.addEventListener('click', function(){
+      const userMsg=div.getAttribute('data-user-msg')||'';
+      // Remove this AI message div and the one before it (user)
+      const prev=div.previousElementSibling;
+      if(prev && prev.classList.contains('msg-user')) prev.remove();
+      div.remove();
+      redoMsg(userMsg);
+    });
+    if(saveBtn) saveBtn.addEventListener('click', function(){
+      const userMsg=div.getAttribute('data-user-msg')||'';
+      saveToWiki(userMsg, bodyEl.textContent);
+    });
+  }
+
+  area.appendChild(div);
+  area.scrollTop=area.scrollHeight;
+  updateMsgCount();
+  return div.querySelector('.body');
+}
+
+function updateMsgCount(){
+  const n=$('chat-history').children.length;
+  $('msg-count').textContent=n?' \u00B7 '+n+' msgs':'';
+}
+
+// ── Streaming State ──
+function setStreaming(on){
+  streaming=on;
+  $('typing-indicator').style.display=on?'':'none';
+  const btn=$('send-btn');
+  btn.disabled=on;
+  if(on){ btn.classList.add('streaming'); btn.innerHTML='<svg width="14" height="14" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2.5" stroke-linecap="round"><rect x="6" y="6" width="12" height="12" rx="2"/></svg>'; }
+  else{ btn.classList.remove('streaming'); btn.innerHTML='<svg width="16" height="16" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2.5" stroke-linecap="round" stroke-linejoin="round"><line x1="22" y1="2" x2="11" y2="13"/><polygon points="22 2 15 22 11 13 2 9 22 2"/></svg>'; }
+}
+
+// ── Send Message (SSE Streaming) ──
+async function sendMessage(text){
+  if(!text||!activeProvider||streaming) return;
+  if(!currentSessionId) currentSessionId='sess-'+Date.now();
+  history.push({role:'user',content:text});
+  addMessage(text,'user',null);
+  $('message').value='';
+  $('message').style.height='auto';
+  setStreaming(true);
+
+  try{
+    const resp=await fetch(API+'chat/message',{
+      method:'POST',
+      headers:{'Content-Type':'application/json'},
+      body:JSON.stringify({message:text,provider_id:activeProvider.id,history:history,rag_wiki:ragWikiEnabled,rag_vector:ragVectorEnabled,mode:chatMode})
+    });
+    const reader=resp.body.getReader();
+    const decoder=new TextDecoder();
+    let buf='', fullText='', bubbleEl=null;
+    let streamDone=false;
+
+    while(!streamDone){
+      const {done,value}=await reader.read();
+      if(value) buf+=decoder.decode(value,{stream:true});
+      if(done) break;
+      const lines=buf.split('\n');
+      buf=lines.pop();
+      for(const line of lines){
+        if(!line.startsWith('data: ')||!line.slice(5)) continue;
+        try{
+          const chunk=JSON.parse(line.slice(5));
+          if(chunk.type==='done'){ streamDone=true; break; }
+          if(chunk.type==='error'){
+            if(!bubbleEl) bubbleEl=addMessage(chunk.delta,'assistant',{error:true});
+            else bubbleEl.innerHTML+=esc(chunk.delta);
+            continue;
+          }
+          if(chunk.type==='delta'){
+            if(!bubbleEl) bubbleEl=addMessage('','assistant',{provider:activeProvider});
+            fullText+=chunk.delta;
+            bubbleEl.innerHTML=renderMd(fullText);
+            bubbleEl.scrollIntoView({block:'nearest',behavior:'smooth'});
+          }else if(chunk.type==='tool'||chunk.type==='raw'){
+            if(!bubbleEl) bubbleEl=addMessage('','assistant',{provider:activeProvider});
+            bubbleEl.innerHTML+=renderMd(chunk.delta);
+          }
+        }catch(e){}
+      }
+    }
+    // Process remaining buffer
+    if(buf){
+      for(const line of buf.split('\n')){
+        if(!line.startsWith('data: ')) continue;
+        try{
+          const chunk=JSON.parse(line.slice(5));
+          if(chunk.type==='delta'&&chunk.delta){
+            if(!bubbleEl) bubbleEl=addMessage('','assistant',{provider:activeProvider});
+            fullText+=chunk.delta;
+            bubbleEl.innerHTML=renderMd(fullText);
+          }
+        }catch(e){}
+      }
+    }
+    history.push({role:'assistant',content:fullText||'(no response)'});
+    saveCurrentSession();
+
+  } catch(e){
+    addMessage('Connection error: '+e.message,'assistant',{error:true});
+  }
+  setStreaming(false);
+}
+
+// ── Input Handling ──
+const textarea=$('message');
+textarea.addEventListener('input', function(){
+  this.style.height='auto';
+  this.style.height=Math.min(this.scrollHeight,500)+'px';
+});
+textarea.addEventListener('keydown', function(e){
+  if(e.key==='Enter'&&!e.shiftKey){ e.preventDefault(); sendMessage(this.value.trim()); }
+});
+$('send-btn').addEventListener('click', function(){ sendMessage(textarea.value.trim()); });
+
+// Quick actions
+$('quick-actions').addEventListener('click', function(e){
+  const chip=e.target.closest('.quick-chip');
+  if(chip){ const msg=chip.getAttribute('data-msg'); if(msg) sendMessage(msg); }
+});
+
+// ── RAG Toggle ──
+$('rag-toggle-btn').addEventListener('click', function(){
+  ragEnabled=!ragEnabled;
+  this.classList.toggle('active', ragEnabled);
+  $('rag-status-dot').style.display=ragEnabled?'':'none';
+});
+$('rag-header').addEventListener('click', function(){
+  const panel=$('rag-panel');
+  panel.classList.toggle('open');
+  $('rag-chevron').textContent=panel.classList.contains('open')?'\u25BC':'\u25B2';
+});
+// Initialize RAG button as active
+$('rag-toggle-btn').classList.add('active');
+$('rag-status-dot').style.display='';
+
+// ── RAG Source Toggle Chips ──
+$('rag-wiki-toggle').addEventListener('click', function(){
+  ragWikiEnabled=!ragWikiEnabled;
+  this.classList.toggle('on', ragWikiEnabled);
+});
+$('rag-vector-toggle').addEventListener('click', function(){
+  ragVectorEnabled=!ragVectorEnabled;
+  this.classList.toggle('on', ragVectorEnabled);
+});
+
+// ── Mode Toggle ──
+document.querySelectorAll('.mode-toggle-btn').forEach(btn=>{
+  btn.addEventListener('click', function(){
+    chatMode=this.getAttribute('data-mode');
+    document.querySelectorAll('.mode-toggle-btn').forEach(b=>b.classList.remove('active'));
+    this.classList.add('active');
+  });
+});
+
+// ── Toast Notification ──
+function showToast(msg, duration){
+  duration=duration||2500;
+  let toast=document.getElementById('save-toast');
+  if(!toast){
+    toast=document.createElement('div');
+    toast.className='save-toast';
+    toast.id='save-toast';
+    document.body.appendChild(toast);
+  }
+  toast.textContent=msg;
+  toast.classList.add('show');
+  setTimeout(()=>toast.classList.remove('show'), duration);
+}
+
+// ── Message Actions ──
+function copyMsg(text){
+  navigator.clipboard.writeText(text).then(()=>showToast('Copied to clipboard'));
+}
+
+function redoMsg(userText){
+  // Remove last assistant message from history
+  if(history.length>=2 && history[history.length-1].role==='assistant'){
+    history.pop();
+  }
+  // Re-send the last user message
+  sendMessage(userText);
+}
+
+async function saveToWiki(question, answer){
+  try{
+    const resp=await fetch(API+'chat/save-to-wiki',{
+      method:'POST',
+      headers:{'Content-Type':'application/json'},
+      body:JSON.stringify({question:question, answer:answer})
+    });
+    const data=await resp.json();
+    if(data.ok) showToast('Saved to Wiki KB!');
+    else showToast('Save failed: '+(data.error||'unknown'));
+  }catch(e){
+    showToast('Save error: '+e.message);
+  }
+}
+
+// ── Manage Providers Modal ──
+function openManageModal(){
+  renderManageList();
+  $('manage-modal').classList.add('open');
+}
+function closeManageModal(){ $('manage-modal').classList.remove('open'); }
+
+function renderManageList(){
+  const list=$('manage-provider-list');
+  list.innerHTML='';
+  if(!providers.length){
+    list.innerHTML='<div style="text-align:center;padding:30px;color:var(--fg);opacity:.35;font-size:.85rem;">No providers configured. Click "+ Add Provider" below.</div>';
+    return;
+  }
+  providers.forEach(p=>{
+    const isCustom=p.id&&p.id.startsWith('custom-');
+    const hasKey=!!p.api_key;
+    const isActive=activeProvider&&activeProvider.id===p.id;
+    const card=document.createElement('div');
+    card.className='manage-card'+(isActive?' active-card':'');
+    card.innerHTML=
+      '<div class="manage-card-icon">'+esc(icon(p))+'</div>'+
+      '<div class="manage-card-info">'+
+        '<div class="manage-card-name">'+esc(p.name)+(isActive?'<span class="manage-card-badge">ACTIVE</span>':'')+(hasKey?'<span class="manage-card-badge" style="background:rgba(158,206,106,.12);color:var(--green);">KEY</span>':'')+'</div>'+
+        '<div class="manage-card-detail">'+esc(p.model||'')+' &middot; '+esc(p.base_url||'')+'</div>'+
+      '</div>'+
+      '<div class="manage-card-actions">'+
+        '<button class="manage-action-btn ma-select" title="Select this provider">&#10003;</button>'+
+        '<button class="manage-action-btn ma-edit" title="'+(hasKey?'Edit':'Add token')+'">'+(hasKey?'&#9998;':'&#128273;')+'</button>'+
+        (isCustom?'<button class="manage-action-btn ma-del" title="Delete">&#128465;</button>':'')+
+      '</div>';
+    card.querySelector('.ma-select').addEventListener('click', function(){
+      selectProvider(p); renderManageList();
+    });
+    card.querySelector('.ma-edit').addEventListener('click', function(){ closeManageModal(); setTimeout(()=>openSettings(p),150); });
+    const delBtn=card.querySelector('.ma-del');
+    if(delBtn) delBtn.addEventListener('click', function(){ deleteProvider(p); });
+    list.appendChild(card);
+  });
+}
+
+$('manage-close').addEventListener('click', closeManageModal);
+$('manage-done').addEventListener('click', closeManageModal);
+$('manage-modal').addEventListener('click', function(e){ if(e.target===this) closeManageModal(); });
+$('manage-add-btn').addEventListener('click', function(){ closeManageModal(); setTimeout(()=>openSettings(),150); });
+
+// Settings gear -> manage modal
+$('tool-settings-btn').addEventListener('click', ()=>openManageModal());
+// Sidebar + Add -> directly open add form
+$('btn-add-provider').addEventListener('click', ()=>openSettings());
+
+// ── Settings (Add/Edit) Modal ──
+function openSettings(provider){
+  editingProvider=provider||null;
+  const title=$('settings-title');
+  const delBtn=$('settings-delete');
+  const saveBtn=$('settings-save');
+  if(provider){
+    const isPreset=!provider.id.startsWith('custom-');
+    const hasKey=!!provider.api_key;
+    title.textContent=isPreset?(hasKey?'Edit Provider':'Configure '+provider.name):'Edit Provider';
+    saveBtn.textContent='Save';
+    delBtn.style.display=isPreset?'none':'';
+    $('set-name').value=provider.name||'';
+    $('set-url').value=provider.base_url||'';
+    $('set-model').value=provider.model||'';
+    $('set-key').value=provider.api_key||'';
+    $('set-format').value=provider.format||'openai';
+  } else {
+    title.textContent='Add Provider';
+    saveBtn.textContent='Save';
+    delBtn.style.display='none';
+    $('set-name').value=''; $('set-url').value=''; $('set-model').value='';
+    $('set-key').value=''; $('set-format').value='openai';
+  }
+  $('settings-modal').classList.add('open');
+}
+function closeSettings(){ $('settings-modal').classList.remove('open'); editingProvider=null; }
+
+$('settings-close').addEventListener('click', closeSettings);
+$('settings-cancel').addEventListener('click', closeSettings);
+$('settings-modal').addEventListener('click', function(e){ if(e.target===this) closeSettings(); });
+
+async function deleteProvider(p){
+  if(!confirm('Delete "'+p.name+'"?')) return;
+  try{
+    await fetch(API+'providers/'+encodeURIComponent(p.id),{method:'DELETE'});
+    providers=await(await fetch(API+'providers')).json();
+    if(activeProvider&&activeProvider.id===p.id){
+      activeProvider=providers[0]||null;
+      updateMeta(); renderModelPicker();
+    }
+    renderProviders();
+    renderManageList();
+  } catch(e){ alert('Delete failed: '+e.message); }
+}
+$('settings-delete').addEventListener('click', function(){ if(editingProvider) deleteProvider(editingProvider); });
+
+$('settings-save').addEventListener('click', async function(){
+  const name=$('set-name').value.trim();
+  const url=$('set-url').value.trim();
+  const model=$('set-model').value.trim();
+  if(!name||!url||!model){ alert('Name, URL, and Model are required.'); return; }
+  const isPreset=editingProvider&&!editingProvider.id.startsWith('custom-');
+  // Presets get forked as custom providers so the key is persisted server-side
+  const provider={
+    id:editingProvider?(isPreset?'custom-'+Date.now():editingProvider.id):'custom-'+Date.now(),
+    name:name,base_url:url,model:model,
+    api_key:$('set-key').value.trim(),
+    format:$('set-format').value,
+    icon:editingProvider?(editingProvider.icon||'\u2699'):'\u2699',
+    description:editingProvider?(editingProvider.description||'Custom'):'Custom'
+  };
+  try{
+    await fetch(API+'providers/save',{
+      method:'POST',headers:{'Content-Type':'application/json'},
+      body:JSON.stringify(provider)
+    });
+    providers=await(await fetch(API+'providers')).json();
+    renderProviders(); renderModelPicker();
+    // Auto-select the saved/forked provider
+    if(editingProvider){
+      activeProvider=provider; updateMeta();
+    } else {
+      activeProvider=provider; updateMeta();
+    }
+    closeSettings();
+    renderManageList();
+  } catch(e){ alert('Save failed: '+e.message); }
+});
+
+// ── Init ──
+async function init(){
+  try{
+    providers=await(await fetch(API+'providers')).json();
+    renderProviders();
+    renderModelPicker();
+
+    if(providers.length>0&&!activeProvider){
+      activeProvider=providers[0];
+      renderProviders();
+      renderModelPicker();
+      updateMeta();
+    }
+    if(!providers.length) openSettings();
+    renderSessions();
+  } catch(e){
+    console.error('Init error:',e);
+    $('chat-history').innerHTML='<div class="msg msg-error"><div class="body">Failed to load chat service. Is the backend running?</div></div>';
+    hideWelcome();
+  }
+}
+
+init();
+})();
+</script>
+<div class="save-toast" id="save-toast"></div>
+</body>
+</html>