本文详细阐述如何在不使用正则表达式的前提下,从包含字母、数字和空格的混合字符串中提取所有数字,并将其转换为数字数组。核心挑战在于正确处理并保留所有零(包括前导零和独立零),避免因默认解析行为导致零的丢失。我们将通过一个高效的迭代方法来解决这一问题。
问题背景与挑战
在前端开发中,我们经常会遇到需要从非结构化字符串中提取特定信息的需求。例如,从一个混合了字母、数字和符号的字符串中提取所有数值。一个常见的需求是将字符串 “00ghj67 h4 h000ytff700jhjk80” 转换为数组 [0, 0, 67, 4, 0, 0, 0, 700, 80]。
这个任务的挑战在于:
- 保留零: 字符串中的前导零或独立零(如 “00” 或 “h000” 中的每个 0)需要作为独立的数字 0 被保留,而不是被忽略或合并。
- 避免正则表达式: 在某些特定场景下,我们可能被要求不使用正则表达式来完成此任务,例如为了学习基础字符串处理逻辑或满足特定性能要求。
- 正确解析多位数字: 连续的数字字符应被解析为一个完整的数字(如 “67” 解析为 67)。
传统方法的局限性
初次尝试解决此问题时,开发者可能会倾向于逐字符遍历,并使用 parseInt() 函数来转换累积的数字字符串。然而,这种方法在处理零时容易出现问题。例如,如果简单地累积数字并使用 parseInt(),可能会丢失独立的零。
考虑以下示例代码,它无法完全满足需求,特别是在保留所有零方面:
function extractNumbersInitial(string) { let arrNumbs = []; let numbers = ""; for (let i = 0; i < string.length; i++) { let elem = string.charAt(i); if (!isNaN(elem) && elem !== ' ') { // 检查是否是数字字符 numbers += elem; } else { // 遇到非数字字符或空格 if (numbers !== "") { arrNumbs.push(parseInt(numbers, 10)); // 转换为数字 numbers = ""; } } } // 处理字符串末尾的数字 if (numbers !== "") { arrNumbs.push(parseInt(numbers, 10)); } return arrNumbs; } // 测试原始字符串 console.log(extractNumbersInitial("00ghj67 h4 h000ytff700jhjk80")); // 预期输出:[0, 0, 67, 4, 0, 0, 0, 700, 80] // 实际输出:[0, 67, 4, 0, 700, 80] - 丢失了部分零
上述代码的 parseInt() 在处理像 “00” 这样的字符串时,会将其解析为单个 0。更重要的是,它没有机制将 0 单独推入数组,除非它是一个独立且后面跟着非数字字符的数字字符串。
立即学习“Java免费学习笔记(深入)”;
优化方案:迭代与特殊零处理
为了克服上述局限性,我们需要一个更精细的字符处理逻辑,尤其是在遇到 0 时。核心思想是:当遇到 0 并且当前没有累积的数字时,立即将其作为一个独立的 0 推入数组。否则,则像处理其他数字一样累积它。
以下是优化后的解决方案:
/** * 从混合字符串中提取数字数组,并保留所有零。 * * @param {string} inputString 包含字母、数字和空格的混合字符串。 * @returns {number[]} 提取出的数字数组。 */ function extractNumbersOptimized(inputString) { let resultArray = []; // 存储提取出的数字 let currentNumberString = ""; // 累积当前正在解析的数字字符串 // 辅助函数:将累积的数字字符串转换为数字并添加到结果数组 const addCurrentNumber = () => { if (currentNumberString) { // 只有当 currentNumberString 非空时才添加 resultArray.push(+currentNumberString); // 使用一元加号快速转换为数字 currentNumberString = ""; // 重置累积字符串 } }; // 遍历输入字符串的每一个字符 for (const char of inputString) { // 1. 特殊处理独立的或前导的零 // 如果当前没有累积的数字字符串,且当前字符是 '0',则立即将其作为 0 添加到数组 if (!currentNumberString && char === '0') { resultArray.push(0); } // 2. 处理非数字字符 // 如果当前字符不是数字('0'到'9'之外),则意味着一个数字段结束 else if (char < '0' || char > '9') { addCurrentNumber(); // 将之前累积的数字添加到数组 } // 3. 处理数字字符 // 如果当前字符是数字,且不是作为独立零被特殊处理的,则累积它 else { currentNumberString += char; } } // 循环结束后,检查是否还有未添加的数字字符串(例如字符串以数字结尾) addCurrentNumber(); return resultArray; } // 示例用法 const input = "00ghj67 h4 h000ytff700jhjk80"; const output = extractNumbersOptimized(input); console.log(output); // 预期输出: [0, 0, 67, 4, 0, 0, 0, 700, 80] const anotherInput = "123abc0def45g00"; console.log(extractNumbersOptimized(anotherInput)); // 预期输出: [123, 0, 45, 0, 0]
代码解析与注意事项
- resultArray 和 currentNumberString: resultArray 用于存储最终的数字结果,currentNumberString 则在遍历过程中累积连续的数字字符。
- addCurrentNumber() 辅助函数: 这是一个局部函数,用于封装将 currentNumberString 转换为数字并推入 resultArray 的逻辑。它确保只有在 currentNumberString 非空时才执行操作,避免将空字符串转换为 0。
- for (const char of inputString): 使用 for…of 循环遍历字符串,这是一种简洁且现代的 JavaScript 遍历方式。
- if (!currentNumberString && char === ‘0’) resultArray.push(0);: 这是解决零丢失问题的关键。
- !currentNumberString 检查当前是否正在累积一个多位数字。如果 currentNumberString 为空,意味着我们刚从一个非数字字符跳过来,或者这是字符串的开头。
- char === ‘0’ 检查当前字符是否为零。
- 如果两者都满足,说明这是一个独立的零或某个数字串的前导零(且该零被视为独立数字),我们立即将其 0 推入 resultArray。
- else if (char < ‘0’ || char > ‘9’) addCurrentNumber();: 当遇到非数字字符时,表示当前的数字段已经结束。此时调用 addCurrentNumber() 将之前累积的 currentNumberString 转换为数字并添加到结果数组。
- else currentNumberString += char;: 如果当前字符是数字,且没有被特殊处理为独立零,则将其追加到 currentNumberString 中,继续累积多位数字。
- 循环结束后的 addCurrentNumber(): 字符串可能以一个或多个数字结尾。循环结束后,currentNumberString 中可能还存有最后一个数字,因此需要再次调用 addCurrentNumber() 来确保将其添加到 resultArray 中。
- +currentNumberString: 使用一元加号 + 是将字符串转换为数字的一种简洁高效的方法。它比 parseInt() 或 Number() 更短,且效果相同。
总结
通过上述优化后的迭代方法,我们成功地在不使用正则表达式的情况下,从混合字符串中提取了所有数字,并特别处理了零的保留问题。这种方法结构清晰,逻辑严谨,能够满足特定场景下的需求。理解这种逐字符处理的逻辑,有助于加深对字符串操作和数据类型转换的理解,为更复杂的字符串解析任务打下基础。
javascript java 前端 正则表达式 前端开发 字符串解析 JavaScript 正则表达式 数据类型 if for 封装 const 字符串 char 循环 类型转换 number