JavaScript:无正则,从字符串中提取数字数组并保留零的技巧

JavaScript:无正则,从字符串中提取数字数组并保留零的技巧

本文详细阐述如何在不使用正则表达式的前提下,从包含字母、数字和空格的混合字符串中提取所有数字,并将其转换为数字数组。核心挑战在于正确处理并保留所有零(包括前导零和独立零),避免因默认解析行为导致零的丢失。我们将通过一个高效的迭代方法来解决这一问题。

问题背景与挑战

前端开发中,我们经常会遇到需要从非结构化字符串中提取特定信息的需求。例如,从一个混合了字母、数字和符号的字符串中提取所有数值。一个常见的需求是将字符串 “00ghj67 h4 h000ytff700jhjk80” 转换为数组 [0, 0, 67, 4, 0, 0, 0, 700, 80]。

这个任务的挑战在于:

  1. 保留零: 字符串中的前导零或独立零(如 “00” 或 “h000” 中的每个 0)需要作为独立的数字 0 被保留,而不是被忽略或合并。
  2. 避免正则表达式: 在某些特定场景下,我们可能被要求不使用正则表达式来完成此任务,例如为了学习基础字符串处理逻辑或满足特定性能要求。
  3. 正确解析多位数字: 连续的数字字符应被解析为一个完整的数字(如 “67” 解析为 67)。

传统方法的局限性

初次尝试解决此问题时,开发者可能会倾向于逐字符遍历,并使用 parseInt() 函数来转换累积的数字字符串。然而,这种方法在处理零时容易出现问题。例如,如果简单地累积数字并使用 parseInt(),可能会丢失独立的零。

考虑以下示例代码,它无法完全满足需求,特别是在保留所有零方面:

function extractNumbersInitial(string) {     let arrNumbs = [];     let numbers = "";     for (let i = 0; i < string.length; i++) {         let elem = string.charAt(i);         if (!isNaN(elem) && elem !== ' ') { // 检查是否是数字字符             numbers += elem;         } else { // 遇到非数字字符或空格             if (numbers !== "") {                 arrNumbs.push(parseInt(numbers, 10)); // 转换为数字                 numbers = "";             }         }     }     // 处理字符串末尾的数字     if (numbers !== "") {         arrNumbs.push(parseInt(numbers, 10));     }     return arrNumbs; }  // 测试原始字符串 console.log(extractNumbersInitial("00ghj67 h4 h000ytff700jhjk80")); // 预期输出:[0, 0, 67, 4, 0, 0, 0, 700, 80] // 实际输出:[0, 67, 4, 0, 700, 80] - 丢失了部分零

上述代码的 parseInt() 在处理像 “00” 这样的字符串时,会将其解析为单个 0。更重要的是,它没有机制将 0 单独推入数组,除非它是一个独立且后面跟着非数字字符的数字字符串。

立即学习Java免费学习笔记(深入)”;

JavaScript:无正则,从字符串中提取数字数组并保留零的技巧

极简智能王

极简智能- 智能聊天ai绘画,还可以创作、编写、翻译、写代码等多种功能,满足用户生活和工作的多方面需求

JavaScript:无正则,从字符串中提取数字数组并保留零的技巧34

查看详情 JavaScript:无正则,从字符串中提取数字数组并保留零的技巧

优化方案:迭代与特殊零处理

为了克服上述局限性,我们需要一个更精细的字符处理逻辑,尤其是在遇到 0 时。核心思想是:当遇到 0 并且当前没有累积的数字时,立即将其作为一个独立的 0 推入数组。否则,则像处理其他数字一样累积它。

以下是优化后的解决方案:

/**  * 从混合字符串中提取数字数组,并保留所有零。  *  * @param {string} inputString 包含字母、数字和空格的混合字符串。  * @returns {number[]} 提取出的数字数组。  */ function extractNumbersOptimized(inputString) {     let resultArray = []; // 存储提取出的数字     let currentNumberString = ""; // 累积当前正在解析的数字字符串      // 辅助函数:将累积的数字字符串转换为数字并添加到结果数组     const addCurrentNumber = () => {         if (currentNumberString) { // 只有当 currentNumberString 非空时才添加             resultArray.push(+currentNumberString); // 使用一元加号快速转换为数字             currentNumberString = ""; // 重置累积字符串         }     };      // 遍历输入字符串的每一个字符     for (const char of inputString) {         // 1. 特殊处理独立的或前导的零         // 如果当前没有累积的数字字符串,且当前字符是 '0',则立即将其作为 0 添加到数组         if (!currentNumberString && char === '0') {             resultArray.push(0);         }         // 2. 处理非数字字符         // 如果当前字符不是数字('0'到'9'之外),则意味着一个数字段结束         else if (char < '0' || char > '9') {             addCurrentNumber(); // 将之前累积的数字添加到数组         }         // 3. 处理数字字符         // 如果当前字符是数字,且不是作为独立零被特殊处理的,则累积它         else {             currentNumberString += char;         }     }      // 循环结束后,检查是否还有未添加的数字字符串(例如字符串以数字结尾)     addCurrentNumber();      return resultArray; }  // 示例用法 const input = "00ghj67 h4 h000ytff700jhjk80"; const output = extractNumbersOptimized(input); console.log(output); // 预期输出: [0, 0, 67, 4, 0, 0, 0, 700, 80]  const anotherInput = "123abc0def45g00"; console.log(extractNumbersOptimized(anotherInput)); // 预期输出: [123, 0, 45, 0, 0]

代码解析与注意事项

  1. resultArray 和 currentNumberString: resultArray 用于存储最终的数字结果,currentNumberString 则在遍历过程中累积连续的数字字符。
  2. addCurrentNumber() 辅助函数: 这是一个局部函数,用于封装将 currentNumberString 转换为数字并推入 resultArray 的逻辑。它确保只有在 currentNumberString 非空时才执行操作,避免将空字符串转换为 0。
  3. for (const char of inputString): 使用 for…of 循环遍历字符串,这是一种简洁且现代的 JavaScript 遍历方式。
  4. if (!currentNumberString && char === ‘0’) resultArray.push(0);: 这是解决零丢失问题的关键。
    • !currentNumberString 检查当前是否正在累积一个多位数字。如果 currentNumberString 为空,意味着我们刚从一个非数字字符跳过来,或者这是字符串的开头。
    • char === ‘0’ 检查当前字符是否为零。
    • 如果两者都满足,说明这是一个独立的零或某个数字串的前导零(且该零被视为独立数字),我们立即将其 0 推入 resultArray。
  5. else if (char < ‘0’ || char > ‘9’) addCurrentNumber();: 当遇到非数字字符时,表示当前的数字段已经结束。此时调用 addCurrentNumber() 将之前累积的 currentNumberString 转换为数字并添加到结果数组。
  6. else currentNumberString += char;: 如果当前字符是数字,且没有被特殊处理为独立零,则将其追加到 currentNumberString 中,继续累积多位数字。
  7. 循环结束后的 addCurrentNumber(): 字符串可能以一个或多个数字结尾。循环结束后,currentNumberString 中可能还存有最后一个数字,因此需要再次调用 addCurrentNumber() 来确保将其添加到 resultArray 中。
  8. +currentNumberString: 使用一元加号 + 是将字符串转换为数字的一种简洁高效的方法。它比 parseInt() 或 Number() 更短,且效果相同。

总结

通过上述优化后的迭代方法,我们成功地在不使用正则表达式的情况下,从混合字符串中提取了所有数字,并特别处理了零的保留问题。这种方法结构清晰,逻辑严谨,能够满足特定场景下的需求。理解这种逐字符处理的逻辑,有助于加深对字符串操作和数据类型转换的理解,为更复杂的字符串解析任务打下基础。

javascript java 前端 正则表达式 前端开发 字符串解析 JavaScript 正则表达式 数据类型 if for 封装 const 字符串 char 循环 类型转换 number

上一篇
下一篇