Семантическая лаборатория

геометрия в языковых моделях

реальные векторы · косинус · 3D-тень PCA

модель: словарь: размерность: 3D-тень: Centered PCA видимый разброс: выбрано: человек

Паспорт карты

Точки, соседи, косинусы, PCA и SVD считаются из реальных эмбеддингов выбранной модели. Видимая сцена — 3D-тень многомерного пространства; полная геометрия остаётся в исходных координатах.

модель: размерность: словарь:

Почему облако меняется

У каждой модели свой корпус, токенизация, задача обучения, нормализация и масштаб осей. PCA заново выбирает три самые заметные оси для каждого набора и показывает только их, поэтому силуэт может резко повернуться или вытянуться. Надёжнее сравнивать соседей, косинусы и SVD-спектр; форму облака читать как подсказку к устройству выбранной модели.

Ближайшие слова

Соседи

    После центрирования

      SVD спектр

      PCA делает видимую 3D-тень облака. SVD показывает, как устроено всё облако целиком: какие независимые оси держат его разброс. Зачем: видеть, какая доля многомерного облака попала в эту картинку, и помнить, что красивая 3D-форма показывает только часть пространства.