/** * Module phát hiện ngôn ngữ cho ExtractPdfNode * @author AI Assistant * @version 1.0.0 */ /** * Kết quả phát hiện ngôn ngữ */ export interface LanguageDetectionResult { language: string; confidence: number; } /** * Ánh xạ mã ngôn ngữ về mã Tesseract * @param langCode Mã ngôn ngữ ISO 639 * @returns Mã ngôn ngữ Tesseract */ export declare function mapLanguageCodeToTesseract(langCode: string): string; /** * Phát hiện ngôn ngữ của văn bản * @param text Văn bản cần phát hiện ngôn ngữ * @returns Mã ngôn ngữ đã phát hiện (mã ISO 639-3) */ export declare function detectLanguage(text: string): Promise; /** * Tạo thống kê ngôn ngữ từ văn bản * @param text Văn bản cần phân tích * @returns Mảng các kết quả phát hiện ngôn ngữ và độ tin cậy */ export declare function generateLanguageStats(text: string): Promise; declare type FrancType = (text: string, options?: { minLength?: number; }) => string; declare type LanguageData = { name: string; type: string; scope: string; iso6393: string; iso6392B?: string; iso6392T?: string; iso6391?: string; }; declare type Iso6393Type = LanguageData[]; /** * Phát hiện ngôn ngữ của văn bản bằng phương pháp đơn giản dựa trên mẫu ký tự * @param text Văn bản cần phát hiện ngôn ngữ * @returns Mã ISO 639-3 của ngôn ngữ phát hiện được */ export declare function detectLanguageSimple(text: string): string; /** * Dữ liệu ngôn ngữ ISO 639-3 giới hạn */ export declare const languageData: LanguageData[]; /** * Chuyển đổi mã ISO 639-3 sang tên ngôn ngữ * @param iso6393 Mã ISO 639-3 của ngôn ngữ * @returns Tên đầy đủ của ngôn ngữ */ export declare function getLanguageName(iso6393: string): string; /** * Chuyển đổi mã ISO 639-3 sang mã ISO 639-1 * @param iso6393 Mã ISO 639-3 của ngôn ngữ * @returns Mã ISO 639-1 tương ứng hoặc 'en' nếu không tìm thấy */ export declare function getIso6391Code(iso6393: string): string; /** * Hàm tải module franc và iso-639-3 (giả lập) * @returns Module franc và iso-639-3 */ export declare function loadLanguageModules(): Promise<{ franc: FrancType; iso6393: Iso6393Type; }>; export {};