Vahemäluks on tavaks nimetada protsessorisse sisseehitatud mälu, mida iseloomustab suur kiirus ja mida kasutatakse kõige sagedamini kasutatavate andmete ajutiseks salvestamiseks.
Vahemälu kasutamise vajadust seletatakse protsessori ja arvuti mälu erinevate osade vahelise teabevahetuse kiiruse erinevusega. Mis tahes rakenduse töö algab vajalike andmete ülekandmisega suhteliselt aeglaselt kõvakettalt RAM-i (arvuti vabamälu) dünaamilisse juhusliku juurdepääsu sektsiooni. Sealt saab neid edastada protsessori kiibis asuvale L2 vahemälule (L2 mälu) või spetsiaalsele kiirele eraldi SRAM kiibile, mis asub protsessori kõrval. Lõpuks saab enimkasutatava teabe edastada L1 vahemällu (esimese taseme mälu), mis on spetsiaalne protsessori osa. Esimese taseme vahemälu suurus on ainult umbes 128 KB, teine tase on juba 512 KB. Võrdluseks võib RAM-i suurus olla 1 GB. Mis tahes käsu täitmine toimub vastavalt teatud skeemile: - inforegistrite analüüs; - esimese taseme vahemälu andmete skannimine; - vahemälu teabe kontrollimine - põhimälu andmete analüüs; - juurdepääs kõvakettamälule. Protsessori kulutatud aeg vajalike andmete saamiseks on otseses proportsioonis teabe salvestamise kohaga. Seega võtab juurdepääs esimese taseme vahemälule 1 kuni 3 tsüklit, teisel tasemel - kuus kuni kaksteist tsüklit ning põhimällu - kümneid ja mõnel juhul ka sadu tsükleid. Vahemälul on serveri tööprotsessis eriline roll, kuna protsessori-mälu liiklus võib nendel juhtudel olla märkimisväärne. Vahemälu struktuur aitab ka vähendada lõhet protsessori kiiruste vahel, mis suurenevad 50 protsenti aastas, ja RAM-i andmeedastuskiiruse vahel, mis kasvavad vaid 5 protsenti. Vahemälu kolmanda ja neljanda taseme jätkuv arendamine näib olevat loogiline samm selles suunas. Teine võimalik arengusuund võib olla üleminek vahemälu programmilisele haldamisele.