import { bs } from "../../../lib/as-bs"; import { OBJECT, TOTAL_OVERHEAD } from "rt/common"; import { __heap_base } from "memory"; import { BACK_SLASH, QUOTE } from "../../custom/chars"; import { DESERIALIZE_ESCAPE_TABLE } from "../../globals/tables"; import { hex4_to_u16_swar } from "../../util/swar"; // Overflow Pattern for Unicode Escapes (READ) // \u0001 0 \u00|01__ + 4 // -\u0001 2 -\u0|001_ + 6 // --\u0001 4 --\u|0001 + 8 // ---\u0001 6 ---\|u0001 + 10 // Formula: overflow = lane + 4 // Overflow Pattern for Unicode Escapes (WRITE) // * = escape, _ = empty // \u0001 0 *___| - 6 // -\u0001 2 -*__| - 4 // --\u0001 4 --*_| - 2 // ---\u0001 6 ---*| - 0 // Formula: 6 - lane // Overflow pattern for Short Escapes (READ) // \n-- 0 \n--| + 0 // -\n 2 -\n-| + 0 // --\n 4 --\n| + 0 // ---\n 6 ---\|n + 2 // Formula: overflow = |lane - 4| // Overflow pattern for Short Escapes (WRITE) // * = escape, _ = empty // \n-- 0 *--_ - 2 // -\n- 2 -*-_ - 2 // --\n 4 --*_ - 2 // ---\n 6 ---* - 0 // Formula: overflow = /** * Deserializes strings back into into their original form using SIMD operations * @param src string to deserialize * @param dst buffer to write to * @returns number of bytes written */ function copyStringFromSource(srcStart: usize, byteLength: usize): string { if (byteLength == 0) return changetype(""); const out = __new(byteLength, idof()); memory.copy(out, srcStart, byteLength); return changetype(out); } // Standalone (whole-value) escaped scanner. Quotes are already stripped, so // `srcEnd` is the payload end and only `\` escapes are handled. Same HYBRID // strategy as the field scanner: escape blocks use a free optimistic u64 store // for the plain prefix; clean runs stream the first block then bulk-memcpy the // remainder. The `backslash_mask_unsafe` hits are confirmed scalarly. // // NOTE: vs the prior overflow scanner this is faster on dense and sparse // escaping but ~20% slower on sustained moderate-density escaping (escape // every ~20 chars), where multi-escape-per-block had an edge. function deserializeEscapedString_SWAR( payloadStart: usize, escapeStart: usize, srcEnd: usize, ): string { const prefixLen = (escapeStart - payloadStart); const outStart = bs.offset - bs.buffer; bs.ensureSize((srcEnd - payloadStart) + 8); // +8 slack for u64 overcopy if (prefixLen != 0) { memory.copy(bs.offset, payloadStart, prefixLen); bs.offset += prefixLen; } let srcStart = escapeStart; const srcEnd8 = srcEnd >= 8 ? srcEnd - 8 : 0; while (srcStart <= srcEnd8) { const block = load(srcStart); let mask = backslash_mask_unsafe(block); if (mask == 0) { store(bs.offset, block); bs.offset += 8; srcStart += 8; if ( srcStart <= srcEnd8 && backslash_mask_unsafe(load(srcStart)) == 0 ) { const runStart = srcStart; srcStart += 8; while ( srcStart <= srcEnd8 && backslash_mask_unsafe(load(srcStart)) == 0 ) { srcStart += 8; } const runLen = (srcStart - runStart); memory.copy(bs.offset, runStart, runLen); bs.offset += runLen; } continue; } store(bs.offset, block); let handled = false; do { const laneIdx = usize(ctz(mask) >> 3); mask &= mask - 1; const srcIdx = srcStart + laneIdx; if ((load(srcIdx) & 0xffff) !== 0x5c) continue; // false positive bs.offset += laneIdx; const code = load(srcIdx, 2); if (code !== 0x75) { store(bs.offset, load(DESERIALIZE_ESCAPE_TABLE + code)); bs.offset += 2; srcStart = srcIdx + 4; } else { store(bs.offset, hex4_to_u16_swar(load(srcIdx, 4))); bs.offset += 2; srcStart = srcIdx + 12; } handled = true; break; } while (mask != 0); if (!handled) { bs.offset += 8; srcStart += 8; } } while (srcStart < srcEnd) { const char = load(srcStart); if (char != BACK_SLASH) { store(bs.offset, char); bs.offset += 2; srcStart += 2; continue; } const code = load(srcStart, 2); if (code !== 0x75) { store(bs.offset, load(DESERIALIZE_ESCAPE_TABLE + code)); bs.offset += 2; srcStart += 4; } else { store(bs.offset, hex4_to_u16_swar(load(srcStart, 4))); bs.offset += 2; srcStart += 12; } } return bs.sliceOut(outStart); } export function deserializeString_SWAR(srcStart: usize, srcEnd: usize): string { // Strip quotes srcStart += 2; srcEnd -= 2; const payloadStart = srcStart; do { const srcEnd16Fast = srcEnd - 16; while (srcStart < srcEnd16Fast) { const m0 = backslash_mask_unsafe(load(srcStart)); const m1 = backslash_mask_unsafe(load(srcStart, 8)); if ((m0 | m1) != 0) break; srcStart += 16; } if (srcStart < srcEnd16Fast) break; while (srcStart < srcEnd) { if (load(srcStart) == BACK_SLASH) break; srcStart += 2; } if (srcStart < srcEnd) break; return copyStringFromSource(payloadStart, srcEnd - payloadStart); } while (false); srcStart = payloadStart; const srcEnd8 = srcEnd - 8; while (srcStart < srcEnd8) { const block = load(srcStart); let mask = backslash_mask_unsafe(block); if (mask === 0) { srcStart += 8; continue; } do { const laneIdx = usize(ctz(mask) >> 3); mask &= mask - 1; const srcIdx = srcStart + laneIdx; const header = load(srcIdx); // Detect false positive (code unit where low byte is 0x5C) if ((header & 0xffff) !== 0x5c) continue; return deserializeEscapedString_SWAR(payloadStart, srcIdx, srcEnd); } while (mask !== 0); srcStart += 8; } while (srcStart < srcEnd) { if (load(srcStart) == BACK_SLASH) { return deserializeEscapedString_SWAR(payloadStart, srcStart, srcEnd); } srcStart += 2; } return copyStringFromSource(payloadStart, srcEnd - payloadStart); } // Writes into the destination field, reusing or resizing the backing string. function writeStringToField( dstFieldPtr: usize, srcStart: usize, byteLength: u32, ): void { if (byteLength == 0) { store(dstFieldPtr, changetype("")); return; } const current = load(dstFieldPtr); let stringPtr: usize; if (current >= __heap_base) { if (changetype