【较难】算法nodeJs:数据分类处理

113 阅读4分钟

描述

信息社会,有海量的数据需要分析处理,比如公安局分析身份证号码、QQ 用户、手机号码、银行帐号等信息及活动记录。采集输入大数据和分类规则,通过大数据分类处理程序,将大数据分类输出。

对于给定的分类规则集 R={R1​,R2​,…,Rm​} ,规范化它,具体地:
∙将 R 中的整数按从小到大的顺序重新排序;
∙去除 R 中的重复元素;
记规范化后的分类规则集为 r={r1​,r2​,…,rm​} 。

对于收集到的、由若干个整数组成的数据集 I ,按照下方的要求,使用规范后的分类规则集 r 输出分类后的结果。

∙对于第 i 条分类规则 ri​ ,如果 I 中存在以 ri​ 为连续子串的整数,则该规则集有效;进一步地,你需要输出有多少条数据符合该规则,以及这些数据在 I 中的位置、数据本身。

子串为从原字符串中,连续的选择一段字符(可以全选、可以不选)得到的新字符串。对应本题中,你需要将整数看作是数字字符串。

输入描述:

第一行先输入一个整数 n(1≦n≦100) 代表数据集 I 中的数据条数。随后,在同一行输出 n 个整数 I1​,I2​,…,In​(0≦Ii​<231) 代表数据。
第二行先输入一个整数 m(1≦m≦100) 代表分类规则集 R 中的规则条数。随后,在同一行输出 m 个整数 R1​,R2​,…,Rm​(0≦Ri​<231) 代表规则。

输出描述:

在一行上:
1.​先输出一个整数 k ,代表一共需要输出的数字个数。简单地说,这个数字为下文中你输出数量的个数统计。
2.​随后,对于规范后的每一条规则,如果其有效:先输出这条规则本身,随后输出一个整数 p ,代表符合该规则的数据条数;随后输出 p 个二元组 {id1​,Iid1​​},{id2​,Iid2​​},…,{idp​,Iidp​​} ,代表符合这条规则的数据在 I 中的位置、数据本身。其中,位置从 0 开始计数。如果其无效,则跳过这条规则。

image.png

备注:

本题由牛客重构过题面,您可能想要阅读原始题面,我们一并附于此处。

【以下为原始题面】

从R依次中取出R ,对I进行处理,找到满足条件的I:

I整数对应的数字需要连续包含R对应的数字。比如R为23,I为231,那么I包含了R ,条件满足 。按R从小到大的顺序:(1)先输出R *;(2)再输出满足条件的I的个数; (3)然后输出满足条件的I在I序列中的位置索引(从0开始); (4)最后再输出I。 附加条件: (1)R需要从小到大排序。相同的R只需要输出索引小的以及满足条件的I,索引大的需要过滤掉***(2)如果没有满足条件的I,对应的R不用输出**(3)最后需要在输出序列的第一个整数位置记录后续整数序列的个数(不包含“个数”本身)序列I:15,123,456,786,453,46,7,5,3,665,453456,745,456,786,453,123(第一个15表明后续有15个整数) 序列R:5,6,3,6,3,0(第一个5表明后续有5个整数) 输出:30, 3,6,0,123,3,453,7,3,9,453456,13,453,14,123,6,7,1,456,2,786,4,46,8,665,9,453456,11,456,12,786说明:30----后续有30个整数3*----从小到大排序,第一个R为0,但没有满足条件的I,不输出0,而下一个R是36---* 存在6个包含3的I 0--- 123所在的原序号为0 123--- 123包含3,满足条件******

const rl = require("readline").createInterface({ input: process.stdin });
var iter = rl[Symbol.asyncIterator]();
const readline = async () => (await iter.next()).value;

void (async function () {
    // Write your code here
    while ((line = await readline())) {
        // I序列,排除了数量
        let iArr = line.split(" ").slice(1);
        // R序列,排除了数量
        let rArr = (await readline()).split(" ").slice(1);
        // R序列排序去重
        rArr = [...new Set(rArr.sort((a, b) => a - b))];
        // console.log(iArr,rArr)
        // 转为对象存储,key为R序列,value为包含key的I序列元素
        let rObj = {};
        rArr.forEach((item) => {
            rObj[item] = [];
        });
        for (let i = 0; i < iArr.length; i++) {
            for (let key in rObj) {
                if (iArr[i].includes(key)) {
                    rObj[key].push({
                        num: iArr[i],
                        index: i,
                    });
                }
            }
        }
        // console.log(rObj)
        let newArr = [];
        for (let key in rObj) {
            // I序列中没有包含R序列的
            if (rObj[key].length == 0) continue;
            else {
                // 先存储R[i],再存储个数
                newArr.push(key, rObj[key].length);
                // 分别存储I序列中的包含R[i]元素的索引和值
                for (let i = 0; i < rObj[key].length; i++) {
                    newArr.push(rObj[key][i].index, rObj[key][i].num);
                }
            }
        }
        newArr.unshift(newArr.length);
        console.log(newArr.join(" "));
    }
})();