atlascodes.ai/ notes
↩ notes  /  research  /  on-device

infinite songs in your pocket

a build log on running a generative audio model fully on-device — the memory budget, the latency wall, and the day it finally sang back.

lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.

01the memory budget

duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.

sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium, totam rem aperiam, eaque ipsa quae ab illo inventore veritatis.

the model didn't need to be smaller. it needed to forget more gracefully.

02the latency wall

nemo enim ipsam voluptatem quia voluptas sit aspernatur aut odit aut fugit, sed quia consequuntur magni dolores eos qui ratione voluptatem sequi nesciunt.

warm starts

neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt.

// warm the kv cache before first token
const sess = await Atlas.load("atlas-8.gguf", {
  ctx: 2048,
  mlock: true,        // pin weights in ram
  threads: 6
});
await sess.prime(seedTokens);

what actually moved the needle

fig. 1 — latency vs. context window, device-local. placeholder.

03it sang back

at vero eos et accusamus et iusto odio dignissimos ducimus qui blanditiis praesentium voluptatum deleniti atque corrupti quos dolores et quas molestias excepturi.

et harum quidem rerum facilis est et expedita distinctio. nam libero tempore, cum soluta nobis est eligendi optio cumque nihil impedit quo minus.


↳ this is a template article. swap the body for real content; structure, type scale and rhythm stay.

the eval harness that kept lying
ta-da — speech on a phone