machine learning
Wyhoduj Model Językowy: Filtruj według Kształtu, Nie Znaków
[DESCRIPTION /]
v2 wytrenowany na zanieczyszczonych danych: wykorzystanie sesji JSONL wyciekłych agentowych systemowych promptów w slocie użytkownika. Model nauczył się, że użytkownicy mówią w wielosekcyjnym markdownzie i odtwarzał ozdoby agenta. Poprawka v2.5: `has_system_prompt_shape()` wykrywa wyciekłe prompty według KSZTAŁTU (liczba nagłówków, długość, frazy odciskowe), nie przez dopasowanie znaków. Trzy sygnały łączą się w decyzję o odrzuceniu. Wskaźniki odrzuceń po ponownym filtrowaniu źródeł hermes3: 87,7%, 90,4%, 93,0%. Ta aktywność prowadzi przez detektor i lekcję, którą naucza: ozdoby ewoluują, struktura pozostaje.
[TITLE contamination/]