第318章 宾主尽欢(3 / 6)

  好在乔泽已经有了跟院士们打交道的经验,有什么话直说就好。

    “你在论文里的加密原语差分密码安全性分析结果很勉强。但在现阶段意义已经不大。简单来说设计良好的密码系统,本身就具备抵御差分密码分析的能力。不过遇到更强大的超算,基于较为原始的加密原理,不需要差分密码分析也能破解。

    压缩算法也是同样的道理。现有基础上的研究不可能让压缩效率有质的提升。否则专业大规模数据最有效的方式也不会是用卡车拖了。要从根本上解决问题,需要基础理论的推陈出新。但这不能怪你们,时代的局限性。”

    乔泽很中肯的点评道。

    “时代的局限性啊,呵呵,说得好呀。哎,我们那个时候是真没你们现在的条件,什么都靠自己摸索,不过话又说回来,小李报告上说豆豆数据库用了一种新的压缩算法,具体是怎么个情况?能不能详细说说?”马旭明主动开口道。

    虽然说对于乔泽的评价心里多少有点不舒服,但说实话,也没太多着恼的情绪。

    主动问出来,还真没什么挑衅的意思,主要是他对新的压缩算法是真的很感兴趣。外行看热闹,内行看门道。

    研究过豆豆之后,马旭明也真觉得豆豆管理数据库的超高能力,跟一些新算法息息相关。

    听了这话,乔泽问道:“你来之前了解过超螺旋代数中关于超复数跟超二项式这些形式的具体描述吗?”

    “只是超复数形式还真难不住我们,小乔啊,我跟你讲,这次我们都是有备而来,专门研究过你的乔代数几何。”一边的张明睿生怕乔泽误会了马明旭的态度,在旁边插了一句。

    “哦。”乔泽点了点头,然后看了身边的苏沐橙一眼,女人立刻进屋给乔泽拿了一叠稿纸出来。

    83中文网最新地址

    “那我给你举个例子,你应该就明白了,先假设一个高维向量,$\mathbf{x}=(x_1, x_2,\ldots, x_n)$,其中$x_i$就是数据的第$i$个特征。

    然后将每个特征表示为超螺旋代数中的超复数形式$x_i = a_i + b_i \epsilon$,这里的$\epsilon$是超越单位。

    现在假设我们通过pca获得了一组特征向量${\mathbf{v}_1,\mathbf{v}_2,\ldots,\mathbf{v}_k}$,这是数据的主要变化方向。

    接下来就能将数据投影到 pca提取的主要特征向量上,并保留前$k$个主要成分,以减少数据的维度。

    压缩后的数据可以表示为$\mathbf{y}=(\mathbf{y}_1,\mathbf{y}_2,\ldots,\mathbf{y}_k)$,其中$\mathbf{y}_i =\mathbf{x}\cdot \mathbf{v}_i$表示数据在第$i$个主成分上的投影。

&nbs

温馨提示:亲爱的读者,为了避免丢失和转马,请勿依赖搜索访问,建议你收藏【落秋中文网】 www.langfanghuayi.com。我们将持续为您更新!

请勿开启浏览器阅读模式,可能将导致章节内容缺失及无法阅读下一章。