短期风速预测-数控滚圆机滚弧机张家港电动倒角机液压倒角机滚弧机短期风速预测-数控滚圆机滚弧机张家港电动倒角机液压倒角机滚弧机给定一个查询结果的一致性程度阈值,可行性判定判断不一致数据上查询结果的一致性程度是否大于给定的阈值。若不是,则查询结果对用户来说是没有意义的,此查询不可行。对于数据量大,查询开销较大的应用中,若是能在查询之前预估查询结果的准确度,则能在很大程度上节省查询的开销以及用户的时间。在查询密集型场景,判定查询的可行性具有重要的意义。查询可行性的判定等价于预估查询结果的一致性。本文采用抽样方法预估查询结果的一致性。时估计算法的运行时间。需要注意的是,这里并不考虑抽样时间和数据预处理时间。实验结果如图1和图2所示。从图1中可以分析得出如下结论:图1两表查询的估计效率F图2三表查询的估计效率F)抽样预估的时间要远远小于Batch算法的时间,此处验证了使用抽样预估准确率的可行性。即,可以在较小的时间内预估查询结果的一致性,若一致性过低时,避免了在原始数据上的查询及一致性计算。具体地,当样本数据从0.0%增至1%时,估计算法比Batch算法快了9~80倍。(2)Bernouli预估的时间要小于其他抽样预估的时间,是因为Bernouli产生的样本是均匀随机的,相同样本量下生成的结果集要小于其它采样方法,但相对误差较高,将在下一组实验中进行说明。(3)对不一致和一致数据进行分别采样的估计算法时间要略高于统一采样的时间,因为统一采样时,不一致数据由于其占据的比例较低,获选采到的可能性较小,其计算一致性多花费的时间较少。(4)Two-Level采样预估的时间要高于其它抽样算法,这是因为Two-Level算法采样的结果集满足查询条件的大小要超过其它采样方法,使得计算结果集以及计算一致性的时间增大。(5)三表查询的执行时间要高于两表查询。(6)随着抽样样本的增多,估计的时间也随之增加。图2的结果与图1的结果保持一致。5.4抽样预估的有效性固定不一致的数据比例不变,同样变化样本规模,从0.03%、0.05%、0.1%、0.5%到1%,接下来将分别在两表查询抽样算法分别对一致的数据部分和不一致的数据部分采样,使得保证抽出的样本大概率下满足查询条件并且服从不一致数据的分布。根据抽出的样本,本文给出了估计一致性程度的算法,证明了一致性程度的估计是渐进无偏的。 本文由公司网站滚圆机网站采集转载中国知网资源整理!www.gunyuanji.name本文由公司网站滚圆机网站采集转载中国知网资源整理!www.gunyuanj
- [2019-08-06]传感器优化设计-液压电动滚圆机
- [2019-08-06]界面自组装-数控滚圆机滚弧机电
- [2019-08-06]澄清效果的影响-数控滚圆机滚弧
- [2019-08-05]刚度的解析公式-数控滚圆机滚弧
- [2019-08-05]制备及缓释性能-数控滚圆机滚弧
- [2019-08-05]组振动建模研究-数控滚圆机滚弧
- [2019-08-04]模型的风电功率预测-数控滚圆机
- [2019-08-04]最大准入容量计算-数控滚圆机滚
- [2019-08-03]传输电缆建模研究-数控滚圆机滚
- [2019-08-03]风电网损及运行-数控滚圆机滚弧