我以后会很

吐槽lanqiao 发表了文章 • 0 个评论 • 5 次浏览 • 23 小时前 • 来自相关话题

输入“我以后会很”,出现的第一个词将会是你未来的生活状态 ​​​​ ...查看全部
输入“我以后会很”,出现的第一个词将会是你未来的生活状态 ​​​​

看完这个,我觉得我活该单身

吐槽lanqiao 发表了文章 • 0 个评论 • 15 次浏览 • 1 天前 • 来自相关话题

为什么人家都这么会写情话,我只会打游戏啊 ​​​​   ...查看全部
为什么人家都这么会写情话,我只会打游戏啊 ​​​​

bb1f8f33gy1fx7suzfa9kj20ku0hiq4t.jpg

 

谁能给我解释一下这个神奇的现象

吐槽lanqiao 发表了文章 • 0 个评论 • 4 次浏览 • 1 天前 • 来自相关话题

饿真的太容易传染了,本来自己不饿,但是只要朋友嚷嚷两遍想吃饭,肚子就立刻开始叫。 ​​​​
饿真的太容易传染了,本来自己不饿,但是只要朋友嚷嚷两遍想吃饭,肚子就立刻开始叫。 ​​​​

求有效关心

吐槽lanqiao 发表了文章 • 0 个评论 • 5 次浏览 • 1 天前 • 来自相关话题

 

dab056a7ly1fx8s6t6vm0j20ku11279o.jpg

 

你说啥,我听不见

吐槽lanqiao 发表了文章 • 0 个评论 • 4 次浏览 • 1 天前 • 来自相关话题

 

679074b3gy1fx7sfuofccj20qv0u27bh.jpg

 

这图都敢发,我肯定是膨胀了

吐槽lanqiao 发表了文章 • 0 个评论 • 8 次浏览 • 1 天前 • 来自相关话题

 

QQ截图20181116140509.png

 

说的就是我,没错了

吐槽lanqiao 发表了文章 • 0 个评论 • 4 次浏览 • 1 天前 • 来自相关话题

胶带人本人  
胶带人本人

48af8002gy1fx7ctehujpj20u01hcdgu.jpg

 

程序员看过来,10个精彩的智力问题!

技术交流lanqiao 发表了文章 • 0 个评论 • 55 次浏览 • 1 天前 • 来自相关话题

1. 给一个瞎子52张扑克牌,并告诉他里面恰好有10张牌是正面朝上的。要求这个瞎子把牌分成两堆,使得每堆牌里正面朝上的牌的张数一样多。瞎子应该怎么做?   答案:把扑克牌分成两堆,一堆10张,一堆42张。然后,把小的那一堆里的所有牌 ...查看全部
1. 给一个瞎子52张扑克牌,并告诉他里面恰好有10张牌是正面朝上的。要求这个瞎子把牌分成两堆,使得每堆牌里正面朝上的牌的张数一样多。瞎子应该怎么做?
 
答案:把扑克牌分成两堆,一堆10张,一堆42张。然后,把小的那一堆里的所有牌全部翻过来。 2. 如何用一枚硬币等概率地产生一个1到3之间的随机整数?如果这枚硬币是不公正的呢?
 
答案:如果是公正的硬币,则投掷两次,“正反”为1,“反正”为2,“正正”为3,“反反”重来。
如果是不公正的硬币,注意到出现“正反”和“反正”的概率一样,因此令“正反反正”、“反正正反”、“正反正反”分别为1、2、3,其余情况重来。另一种更妙的办法是,投掷三次硬币,“正反反”为1,“反正反”为2,“反反正”为3,其余情况重来。 3. 30枚面值不全相同的硬币摆成一排,甲、乙两个人轮流选择这排硬币的其中一端,并取走最外边的那枚硬币。如果你先取硬币,能保证得到的钱不会比对手少吗?
 
答案:先取者可以让自己总是取奇数位置上的硬币或者总是取偶数位置上的硬币。数一数是奇数位置上的面值总和多还是偶数位置上的面值总和多,然后总是取这些位置上的硬币就可以了。 4. 一个环形轨道上有n个加油站,所有加油站的油量总和正好够车跑一圈。证明,总能找到其中一个加油站,使得初始时油箱为空的汽车从这里出发,能够顺利环行一圈回到起点。
 
答案:总存在一个加油站,仅用它的油就足够跑到下一个加油站(否则所有加油站的油量加起来将不够全程)。把下一个加油站的所有油都提前搬到这个加 油站来,并把油已被搬走的加油站无视掉。在剩下的加油站中继续寻找油量足以到达下个加油站的地方,不断合并加油站,直到只剩一个加油站为止。显然从这里出发就能顺利跑完全程。
 
另一种证明方法:先让汽车油箱里装好足够多的油,随便从哪个加油站出发试跑一圈。车每到一个加油站时,记录此时油箱里剩下的油量,然后把那个加油站的油全部装上。试跑完一圈后,检查刚才路上到哪个加油站时剩的油量最少,那么空着油箱从那里出发显然一定能跑完全程。 5. 初始时,两个口袋里各有一个球。把后面的n-2个球依次放入口袋,放进哪个口袋其概率与各口袋已有的球数成正比。这样下来,球数较少的那个口袋平均期望有多少个球?
 
答案:先考虑一个看似无关的问题——怎样产生一个1到n的随机排列。首先,在纸上写下数字1;然后,把2写在1的左边或者右边;然后,把3写在最 左边,最右边,或者插进1和2之间……总之,把数字i等概率地放进由前面i-1个数产生的(包括最左端和最右端在内的)共i个空位中的一个。这样生成的显 然是一个完全随机的排列。
 
我们换一个角度来看题目描述的过程:假想用一根绳子把两个球拴在一起,把这根绳子标号为1。接下来,把其中一个小球分裂成两个小球,这两个小球用 标号为2的绳子相连。总之,把“放进第i个球”的操作想象成把其中一个球分裂成两个用标有i-1的绳子相连的小球。联想我们前面的讨论,这些绳子的标号事 实上是一个随机的全排列,也就是说最开始绳子1的位置最后等可能地出现在每个地方。也就是说,它两边的小球个数(1,n-1)、(2,n-2)、 (3,n-3)、……、(n-1,1)这n-1种情况等可能地发生。因此,小袋子里的球数大约为n/4个。准确地说,当n为奇数时,小袋子里的球数为 (n+1)/4;当n为偶数时,小袋子里的球数为n^2/(4n-4)。 6. 考虑一个n*n的棋盘,把有公共边的两个格子叫做相邻的格子。初始时,有些格子里有病毒。每一秒钟后,只要一个格子至少有两个相邻格子染上了病毒,那么他自己也会被感染。为了让所有的格子都被感染,初始时最少需要有几个带病毒的格子?给出一种方案并证明最优性。
 
答案:至少要n个,比如一条对角线上的n个格子。n个格子也是必需的。当一个新的格子被感染后,全体被感染的格子所组成的图形的周长将减少0个、 2个或4个单位(具体减少了多少要看它周围被感染的格子有多少个)。又因为当所有格子都被感染后,图形的周长为4n,因此初始时至少要有n个被感染的格 子。 7. 在一个m*n的棋盘上,有k个格子里放有棋子。是否总能对所有棋子进行红蓝二染色,使得每行每列的红色棋子和蓝色棋子最多差一个?
 
答案:可以。建一个二分图G(X,Y),其中X有m个顶点代表了棋盘的m个行,Y有n个顶点代表了棋盘的n个列。第i行第j列有棋子就在X(i) 和Y(j)之间连一条边。先找出图G里的所有环(由于是二分图,环的长度一定是偶数),把环里的边红蓝交替染色。剩下的没染色的图一定是一些树。对每棵树 递归地进行操作:去掉一个叶子节点和对应边,把剩下的树进行合法的红蓝二染色,再把刚才去掉的顶点和边加回去,给这个边适当的颜色以满足要求。 8. 任意给一个8*8的01矩阵,你每次只能选一个3*3或者4*4的子矩阵并把里面的元素全部取反。是否总有办法把矩阵里的所有数全部变为1?
 
答案:不能。大矩阵中有36个3*3的小矩阵和25个4*4的小矩阵,因此总共有61种可能的操作。显然,给定一个操作序列,这些操作的先后顺序 是无关紧要的;另外,在一个操作序列中使用两种或两种以上相同的操作也是无用的。因此,实质不同的操作序列只有2^61种。但8*8的01矩阵一共有 2^64种,因此不是每种情况都有办法达到目的。 9. 五个洞排成一排,其中一个洞里藏有一只狐狸。每个夜晚,狐狸都会跳到一个相邻的洞里;每个白天,你都只允许检查其中一个洞。怎样才能保证狐狸最终会被抓住?
 
答案:按照2, 3, 4, 2, 3, 4的顺序检查狐狸洞可以保证抓住狐狸。为了说明这个方案是可行的,用集合F表示狐狸可能出现的位置,初始时F = {1, 2, 3, 4, 5}。如果它不在2号洞,则第二天狐狸已经跑到了F = {2, 3, 4, 5}。如果此时它不在3号洞,则第三天狐狸一定跑到了F = {1, 3, 4, 5}。如果此时它不在4号洞,则再过一晚后F = {2, 4}。如果此时它不在2号洞,则再过一天F = {3, 5}。如果此时它不在3号洞,再过一天它就一定跑到4号洞了。
方案不是唯一的,下面这些方案都是可行的:
2, 3, 4, 4, 3, 2
4, 3, 2, 2, 3, 4
4, 3, 2, 4, 3, 2
 10. 一个经典老题是说,把一个3*3*3的立方体切成27个单位立方体,若每一刀切完后都允许重新摆放各个小块的位置,最少可以用几刀?答案仍然是6刀,因为 正中间那个单位立方体的6个面都是后来才切出来的,因此怎么也需要6刀。考虑这个问题:若把一个n*n*n的立方体切成一个个单位立方体,最少需要几刀?
 
答案:事实上,从一个更强的命题出发反而能使问题变得更简单。对于一个a*b*c的长方体,我们需要f(a)+f(b)+f(c)刀,其中 f(x)=⌈log(x)/log(2)⌉。只需要注意到,在整个过程中的任何一步,切完当前最大的块所需要的刀数也就等于整个过程还需要的刀数,因为其 它小块需要的刀数都不会超过最大块所需刀数,它们都可以与最大块一道并行处理。这表明,我们的最优决策即是让当前的最大块尽可能的小,也就是说要把当前的 最大块尽可能相等地切成两半。利用数学归纳法,我们可以很快得到本段开头的结论。

大数据体系知识术语

技术交流lanqiao 发表了文章 • 0 个评论 • 18 次浏览 • 1 天前 • 来自相关话题

大数据的出现带来了许多新的术语,但这些术语往往比较难以理解。因此,我们通过本文给出一个常用的大数据术语表,抛砖引玉,供大家深入了解,部分定义参考了相应的博客文章。     A ...查看全部
大数据的出现带来了许多新的术语,但这些术语往往比较难以理解。因此,我们通过本文给出一个常用的大数据术语表,抛砖引玉,供大家深入了解,部分定义参考了相应的博客文章。
 
 
A


  • 聚合 (Aggregation) – 搜索、合并、显示数据的过程


  • 算法 (Algorithms) – 可以完成某种数据分析的数学公式


  • 分析法 (Analytics) – 用于发现数据的内在涵义


  • 异常检测 (Anomaly detection) – 在数据集中搜索与预期模式或行为不匹配的数据项。除了“Anomalies”,用来表示异常的词有以下几种:outliers, exceptions, surprises, contaminants.他们通常可提供关键的可执行信息


  • 匿名化 (Anonymization) – 使数据匿名,即移除所有与个人隐私相关的数据


  • 应用 (Application) – 实现某种特定功能的计算机软件


  • 人工智能 (Artificial Intelligence) – 研发智能机器和智能软件,这些智能设备能够感知周遭的环境,并根据要求作出相应的反应,甚至能自我学习。


B


  • 行为分析法 (Behavioural Analytics) – 这种分析法是根据用户的行为如“怎么做”,“为什么这么做”,以及“做了什么”来得出结论,而不是仅仅针对人物和时间的一门分析学科,它着眼于数据中的人性化模式


  • 大数据科学家 (Big Data Scientist) – 能够设计大数据算法使得大数据变得有用的人


  • 大数据创业公司 (Big data startup) – 指研发最新大数据技术的新兴公司


  • 生物测定术 (Biometrics) – 根据个人的特征进行身份识别


  • B字节 (BB: Brontobytes) – 约等于1000 YB(Yottabytes),相当于未来数字化宇宙的大小。1 B字节包含了27个0!


  • 商业智能 (Business Intelligence) – 是一系列理论、方法学和过程,使得数据更容易被理解


C


  • 分类分析 (Classification analysis) – 从数据中获得重要的相关性信息的系统化过程; 这类数据也被称为元数据(meta data),是描述数据的数据


  • 云计算 (Cloud computing) – 构建在网络上的分布式计算系统,数据是存储于机房外的(即云端)


  • 聚类分析 (Clustering analysis) – 它是将相似的对象聚合在一起,每类相似的对象组合成一个聚类(也叫作簇)的过程。这种分析方法的目的在于分析数据间的差异和相似性


  • 冷数据存储 (Cold data storage) – 在低功耗服务器上存储那些几乎不被使用的旧数据。但这些数据检索起来将会很耗时


  • 对比分析 (Comparative analysis) – 在非常大的数据集中进行模式匹配时,进行一步步的对比和计算过程得到分析结果


  • 复杂结构的数据 (Complex structured data) – 由两个或多个复杂而相互关联部分组成的数据,这类数据不能简单地由结构化查询语言或工具(SQL)解析


  • 计算机产生的数据 (Computer generated data) – 如日志文件这类由计算机生成的数据


  • 并发 (Concurrency) – 同时执行多个任务或运行多个进程


  • 相关性分析 (Correlation analysis) – 是一种数据分析方法,用于分析变量之间是否存在正相关,或者负相关


  • 客户关系管理 (CRM: Customer Relationship Management) – 用于管理销售、业务过程的一种技术,大数据将影响公司的客户关系管理的策略


D


  • 仪表板 (Dashboard) – 使用算法分析数据,并将结果用图表方式显示于仪表板中


  • 数据聚合工具 (Data aggregation tools) – 将分散于众多数据源的数据转化成一个全新数据源的过程


  • 数据分析师 (Data analyst) – 从事数据分析、建模、清理、处理的专业人员


  • 数据库 (Database) – 一个以某种特定的技术来存储数据集合的仓库


  • 数据库即服务 (Database-as-a-Service) – 部署在云端的数据库,即用即付,例如亚马逊云服务 (AWS: Amazon Web Services)


  • 数据库管理系统 (DBMS: Database Management System) – 收集、存储数据,并提供数据的访问


  • 数据中心 (Data centre) – 一个实体地点,放置了用来存储数据的服务器


  • 数据清洗 (Data cleansing) – 对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性


  • 数据管理员 (Data custodian) – 负责维护数据存储所需技术环境的专业技术人员


  • 数据道德准则 (Data ethical guidelines) – 这些准则有助于组织机构使其数据透明化,保证数据的简洁、安全及隐私


  • 数据订阅 (Data feed) – 一种数据流,例如Twitter订阅和RSS


  • 数据集市 (Data marketplace) – 进行数据集买卖的在线交易场所


  • 数据挖掘 (Data mining) – 从数据集中发掘特定模式或信息的过程


  • 数据建模 (Data modelling) – 使用数据建模技术来分析数据对象,以此洞悉数据的内在涵义


  • 数据集 (Data set) – 大量数据的集合


  • 数据虚拟化 (Data virtualization) – 数据整合的过程,以此获得更多的数据信息,这个过程通常会引入其他技术,例如数据库,应用程序,文件系统,网页技术,大数据技术等等


  • 去身份识别 (De-identification) – 也称为匿名化(anonymization),确保个人不会通过数据被识别


  • 判别分析 (Discriminant analysis) – 将数据分类;按不同的分类方式,可将数据分配到不同的群组,类别或者目录。是一种统计分析法,可以对数据中某些群组或集群的已知信息进行分析,并从中获取分类规则。


  • 分布式文件系统 (Distributed File System) – 提供简化的,高可用的方式来存储、分析、处理数据的系统


  • 文件存贮数据库 (Document Store Databases) – 又称为文档数据库(document-oriented database), 为存储、管理、恢复文档数据而专门设计的数据库,这类文档数据也称为半结构化数据


E


  • 探索性分析 (Exploratory analysis) – 在没有标准的流程或方法的情况下从数据中发掘模式。是一种发掘数据和数据集主要特性的一种方法


  • E字节 (EB: Exabytes) – 约等于1000 PB(petabytes), 约等于1百万 GB。如今全球每天所制造的新信息量大约为1 EB


  • 提取-转换-加载 (ETL: Extract, Transform and Load) – 是一种用于数据库或者数据仓库的处理过程,天善学院有国内唯一的最全的 ETL 学习课程。即从各种不同的数据源提取(E)数据,并转换(T)成能满足业务需要的数据,最后将其加载(L)到数据库


F


  • 故障切换 (Failover) – 当系统中某个服务器发生故障时,能自动地将运行任务切换到另一个可用服务器或节点上


  • 容错设计 (Fault-tolerant design) – 一个支持容错设计的系统应该能够做到当某一部分出现故障也能继续运行


G


  • 游戏化 (Gamification) – 在其他非游戏领域中运用游戏的思维和机制,这种方法可以以一种十分友好的方式进行数据的创建和侦测,非常有效。


  • 图形数据库 (Graph Databases) – 运用图形结构(例如,一组有限的有序对,或者某种实体)来存储数据,这种图形存储结构包括边缘、属性和节点。它提供了相邻节点间的自由索引功能,也就是说,数据库中每个元素间都与其他相邻元素直接关联。


  • 网格计算 (Grid computing) – 将许多分布在不同地点的计算机连接在一起,用以处理某个特定问题,通常是通过云将计算机相连在一起。


H


  • Hadoop – 一个开源的分布式系统基础框架,可用于开发分布式程序,进行大数据的运算与存储。


  • Hadoop 数据库 (HBase) – 一个开源的、非关系型、分布式数据库,与Hadoop框架共同使用


  • HDFS – Hadoop 分布式文件系统 (Hadoop Distributed File System);是一个被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统


  • 高性能计算 (HPC: High-Performance-Computing) – 使用超级计算机来解决极其复杂的计算问题


I


  • 内存数据库 (IMDB: In-memory) – 一种数据库管理系统,与普通数据库管理系统不同之处在于,它用主存来存储数据,而非硬盘。其特点在于能高速地进行数据的处理和存取。


  • 物联网 (Internet of Things) – 在普通的设备中装上传感器,使这些设备能够在任何时间任何地点与网络相连。


J


  • 法律上的数据一致性 (Juridical data compliance) – 当你使用的云计算解决方案,将你的数据存储于不同的国家或不同的大陆时,就会与这个概念扯上关系了。你需要留意这些存储在不同国家的数据是否符合当地的法律。


K


  • 键值数据库 (KeyValue Databases) – 数据的存储方式是使用一个特定的键,指向一个特定的数据记录,这种方式使得数据的查找更加方便快捷。键值数据库中所存的数据通常为编程语言中基本数据类型的数据。


L


  • 延迟 (Latency) – 表示系统时间的延迟


  • 遗留系统 (Legacy system) – 是一种旧的应用程序,或是旧的技术,或是旧的计算系统,现在已经不再支持了。


  • 负载均衡 (Load balancing) – 将工作量分配到多台电脑或服务器上,以获得最优结果和最大的系统利用率。


  • 位置信息 (Location data) – GPS信息,即地理位置信息。


  • 日志文件 (Log file) – 由计算机系统自动生成的文件,记录系统的运行过程。


M


  • M2M数据 (Machine2Machine data) – 两台或多台机器间交流与传输的内容


  • 机器数据 (Machine data) – 由传感器或算法在机器上产生的数据


  • 机器学习 (Machine learning) – 人工智能的一部分,指的是机器能够从它们所完成的任务中进行自我学习,通过长期的累积实现自我改进。


  • MapReduce – 是处理大规模数据的一种软件框架(Map: 映射,Reduce: 归纳)。


  • 大规模并行处理 (MPP: Massively Parallel Processing) – 同时使用多个处理器(或多台计算机) 处理同一个计算任务。


  • 元数据 (Metadata) – 被称为描述数据的数据,即描述数据数据属性(数据是什么)的信息。


  • MongoDB – 一种开源的非关系型数据库(NoSQL database)


  • 多维数据库 (Multi-Dimensional Databases) – 用于优化数据联机分析处理(OLAP)程序,优化数据仓库的一种数据库。


  • 多值数据库 (MultiValue Databases) – 是一种非关系型数据库(NoSQL), 一种特殊的多维数据库:能处理3个维度的数据。主要针对非常长的字符串,能够完美地处理HTML和XML中的字串。


N


  • 自然语言处理 (Natural Language Processing) – 是计算机科学的一个分支领域,它研究如何实现计算机与人类语言之间的交互。


  • 网络分析 (Network analysis) – 分析网络或图论中节点间的关系,即分析网络中节点间的连接和强度关系。


  • NewSQL – 一个优雅的、定义良好的数据库系统,比SQL更易学习和使用,比NoSQL更晚提出的新型数据库


  • NoSQL – 顾名思义,就是“不使用SQL”的数据库。这类数据库泛指传统关系型数据库以外的其他类型的数据库。这类数据库有更强的一致性,能处理超大规模和高并发的数据。


O


  • 对象数据库 (Object Databases) – (也称为面象对象数据库)以对象的形式存储数据,用于面向对象编程。它不同于关系型数据库和图形数据库,大部分对象数据库都提供一种查询语言,允许使用声明式编程(declarative programming)访问对象.


  • 基于对象图像分析 (Object-based Image Analysis) – 数字图像分析方法是对每一个像素的数据进行分析,而基于对象的图像分析方法则只分析相关像素的数据,这些相关像素被称为对象或图像对象。


  • 操作型数据库 (Operational Databases) – 这类数据库可以完成一个组织机构的常规操作,对商业运营非常重要,一般使用在线事务处理,允许用户访问 、收集、检索公司内部的具体信息。


  • 优化分析 (Optimization analysis) – 在产品设计周期依靠算法来实现的优化过程,在这一过程中,公司可以设计各种各样的产品并测试这些产品是否满足预设值。


  • 本体论 (Ontology) – 表示知识本体,用于定义一个领域中的概念集及概念之间的关系的一种哲学思想。(译者注: 数据被提高到哲学的高度,被赋予了世界本体的意义,成为一个独立的客观数据世界)


  • 异常值检测 (Outlier detection) – 异常值是指严重偏离一个数据集或一个数据组合总平均值的对象,该对象与数据集中的其他它相去甚远,因此,异常值的出现意味着系统发生问题,需要对此另加分析。


P


  • 模式识别 (Pattern Recognition) – 通过算法来识别数据中的模式,并对同一数据源中的新数据作出预测


  • P字节 (PB: Petabytes) – 约等于1000 TB(terabytes), 约等于1百万 GB (gigabytes)。欧洲核子研究中心(CERN)大型强子对撞机每秒产生的粒子个数就约为1 PB


  • 平台即服务 (PaaS: Platform-as-a-Service) – 为云计算解决方案提供所有必需的基础平台的一种服务


  • 预测分析 (Predictive analysis) – 大数据分析方法中最有价值的一种分析方法,这种方法有助于预测个人未来(近期)的行为,例如某人很可能会买某些商品,可能会访问某些网站,做某些事情或者产生某种行为。通过使用各种不同的数据集,例如历史数据,事务数据,社交数据,或者客户的个人信息数据,来识别风险和机遇


  • 隐私 (Privacy) – 把具有可识别出个人信息的数据与其他数据分离开,以确保用户隐私。


  • 公共数据 (Public data) – 由公共基金创建的公共信息或公共数据集。


Q


  • 数字化自我 (Quantified Self) – 使用应用程序跟踪用户一天的一举一动,从而更好地理解其相关的行为


  • 查询 (Query) – 查找某个问题答案的相关信息


R


  • 再识别 (Re-identification) – 将多个数据集合并在一起,从匿名化的数据中识别出个人信息


  • 回归分析 (Regression analysis) – 确定两个变量间的依赖关系。这种方法假设两个变量之间存在单向的因果关系(译者注:自变量,因变量,二者不可互换)


  • RFID – 射频识别; 这种识别技术使用一种无线非接触式射频电磁场传感器来传输数据


  • 实时数据 (Real-time data) – 指在几毫秒内被创建、处理、存储、分析并显示的数据


  • 推荐引擎 (Recommendation engine) – 推荐引擎算法根据用户之前的购买行为或其他购买行为向用户推荐某种产品


  • 路径分析 (Routing analysis) – 针对某种运输方法通过使用多种不同的变量分析从而找到一条最优路径,以达到降低燃料费用,提高效率的目的


S


  • 半结构化数据 (Semi-structured data) – 半结构化数据并不具有结构化数据严格的存储结构,但它可以使用标签或其他形式的标记方式以保证数据的层次结构


  • 情感分析 (Sentiment Analysis) – 通过算法分析出人们是如何看待某些话题


  • 信号分析 (Signal analysis) – 指通过度量随时间或空间变化的物理量来分析产品的性能。特别是使用传感器数据。


  • 相似性搜索 (Similarity searches) – 在数据库中查询最相似的对象,这里所说的数据对象可以是任意类型的数据


  • 仿真分析 (Simulation analysis) – 仿真是指模拟真实环境中进程或系统的操作。仿真分析可以在仿真时考虑多种不同的变量,确保产品性能达到最优


  • 智能网格 (Smart grid) – 是指在能源网中使用传感器实时监控其运行状态,有助于提高效率


  • 软件即服务 (SaaS: Software-as-a-Service) – 基于Web的通过浏览器使用的一种应用软件


  • 空间分析 (Spatial analysis) – 空间分析法分析地理信息或拓扑信息这类空间数据,从中得出分布在地理空间中的数据的模式和规律


  • SQL – 在关系型数据库中,用于检索数据的一种编程语言


  • 结构化数据 (Structured data) -可以组织成行列结构,可识别的数据。这类数据通常是一条记录,或者一个文件,或者是被正确标记过的数据中的某一个字段,并且可以被精确地定位到。


T


  • T字节 (TB: Terabytes) – 约等于1000 GB(gigabytes)。1 TB容量可以存储约300小时的高清视频。


  • 时序分析 (Time series analysis) – 分析在重复测量时间里获得的定义良好的数据。分析的数据必须是良好定义的,并且要取自相同时间间隔的连续时间点。


  • 拓扑数据分析 (Topological Data Analysis) – 拓扑数据分析主要关注三点:复合数据模型、集群的识别、以及数据的统计学意义。


  • 交易数据 (Transactional data) – 随时间变化的动态数据


  • 透明性 (Transparency) – 消费者想要知道他们的数据有什么作用、被作何处理,而组织机构则把这些信息都透明化了。


U


  • 非结构化数据 (Un-structured data) – 非结构化数据一般被认为是大量纯文本数据,其中还可能包含日期,数字和实例。


V


  • 价值 (Value) – (译者注:大数据4V特点之一) 所有可用的数据,能为组织机构、社会、消费者创造出巨大的价值。这意味着各大企业及整个产业都将从大数据中获益。


  • 可变性 (Variability) – 也就是说,数据的含义总是在(快速)变化的。例如,一个词在相同的推文中可以有完全不同的意思。


  • 多样 (Variety) – (译者注:大数据4V特点之一) 数据总是以各种不同的形式呈现,如结构化数据,半结构化数据,非结构化数据,甚至还有复杂结构化数据


  • 高速 (Velocity) – (译者注:大数据4V特点之一) 在大数据时代,数据的创建、存储、分析、虚拟化都要求被高速处理。


  • 真实性 (Veracity) – 组织机构需要确保数据的真实性,才能保证数据分析的正确性。因此,真实性(Veracity)是指数据的正确性。


  • 可视化 (Visualization) – 只有正确的可视化,原始数据才可被投入使用。这里的“可视化”并非普通的图型或饼图,可视化指是的复杂的图表,图表中包含大量的数据信息,但可以被很容易地理解和阅读。


  • 大量 (Volume) – (译者注:大数据4V特点之一) 指数据量,范围从Megabytes至Brontobytes


W


  • 天气数据 (Weather data) – 是一种重要的开放公共数据来源,如果与其他数据来源合成在一起,可以为相关组织机构提供深入分析的依据


X


  • XML数据库 (XML Databases) – XML数据库是一种以XML格式存储数据的数据库。XML数据库通常与面向文档型数据库相关联,开发人员可以对XML数据库的数据进行查询,导出以及按指定的格式序列化


Y


  • Y字节 (Yottabytes) – 约等于1000 ZB (Zettabytes), 约等于250万亿张DVD的数据容量。现今,整个数字化宇宙的数据量为1 YB, 并且将每18年翻一番。


Z


  • Z字节 (ZB: Zettabytes) – 约等于1000 EB (Exabytes), 约等于1百万 TB。据预测,到2016年全球范围内每天网络上通过的信息大约能达到1 ZB。


 
 
附:存储容量单位换算表
 
1 Bit (比特) = Binary Digit
8 Bits = 1 Byte (字节)
1,000 Bytes = 1 Kilobyte
1,000 Kilobytes = 1 Megabyte
1,000 Megabytes = 1 Gigabyte
1,000 Gigabytes = 1 Terabyte
1,000 Terabytes = 1 Petabyte
1,000 Petabytes = 1 Exabyte
1,000 Exabytes = 1 Zettabyte
1,000 Zettabytes = 1 Yottabyte
1,000 Yottabytes = 1 Brontobyte
1,000 Brontobytes = 1 Geopbyte
 

写给那些转行做前端的人们

技术交流lanqiao 发表了文章 • 0 个评论 • 16 次浏览 • 1 天前 • 来自相关话题

写给那些转行做前端的人们,如果你只为赚取丰厚的年薪来转行前端,请你就此止步吧。   前端是一个相对比较新的行业。但在这几年期间,随着W3C标准的不断更新以及node.js的兴起,基于node.js一系列的工具和诸多前端框架都参差不齐 ...查看全部
写给那些转行做前端的人们,如果你只为赚取丰厚的年薪来转行前端,请你就此止步吧。
 
前端是一个相对比较新的行业。但在这几年期间,随着W3C标准的不断更新以及node.js的兴起,基于node.js一系列的工具和诸多前端框架都参差不齐的浮出水面。大多数不了解前端的人转行前端,第一点原因是前端极其低的门槛,在培训机构培训3个月即可速成。第二点是他们对前端的理解,普遍停留在毫无计算含量的网页布局以及和美工一样的样式设计。计算机专业的人选择前端,是因为他们认为前端不需要过多的逻辑思维计算,他们讨厌编程。非计算机专业的人选择前端,他们看到了前端的前景,以及不需要计算机的知识就可以快速上手。
  

我想对第一类人说,你们走入了一个巨坑。前端最最基本的三个核心技能:HTML、JS、CSS,其中最能代表前端的就是Javascript了。
 
 
如图,是2015年github上最受欢迎的语言排行榜:
 

1.png

 
 
如图,是github2016年1月至2016年7月仓库排行榜TOP10:
 

2.png

 
 
JavaScript身为一种动态的弱语言,在实际项目中设计最合适的模型高效率解决现实问题本身就很有挑战。作为一种典型的新生代编程语言JavaScript 特性丰富,使用灵活,性能优良。面向对象、函数式编程、各种设计模式、MVC 和 MVVM,这些本身就有足够的吸引力。随着更多的程序员转入JavaScript,它的标准也在不断规范,一些其他语言的特性也不断的融入其语法当中。或许不久的将来,JavaScript会和TypeScript一样拥有静态类型检查的功能。如此重要的核心语言又怎么能离的开编程呢。前端是一个发展速度迅速的行业,从以前的传统网站到如今HTML5的发展,以及Node.js的出现,相关Node.js 工具也纷纷出来。CommonJS、AMD、CMD、UMD 等模块式的开发思想也诞生出了像SeaJS、RequireJS 等模块化工具。MV* 库铺卷而来,vue/angular/react,前端框架相互竞争,2014年的angular到15年的react。作为一个前端工程师,我们每时每刻都应该跟上技术的潮流,不断学习,所以我会劝那些因为厌恶编程而转入前端的程序员们,你们走错了方向。
 
我想对非计算机专业想转行前端的人说,请你们慎重考虑。前端工程师首先是软件工程师,基础是最重要的,如果基础不扎实,一切应用技能就都是“浮云”。前端的基础是什么?HTML、CSS、JavaScript基本功,数学、算法、数据结构、操作系统、编译原理基本功。不要觉得自己做了几个唯美的动画网页就觉得接近前端了。前端的大牛,通常是一个各种领域都精通的全栈,那些为前端开源代码做贡献的人,哪个在做项目的时候不是编写大量单元测试,文档的说明注释,说到头来就回到了javascript,编程基础。就是这样,周围还是会有人误认为前端就是一个没有技术含量的静态网页编写的职位。这里只送一句话:You will be abandoned in this era。
 
最近2个季度我们一直在招前端,在这长达两个多月面试中,我始终都没有聘到合适的前端,他们的简历通常都是如下这样的:
 
[list=none]
[*]
1、与UI设计师合作,快速开发符合W3C标准的网站前端页面;[/*]
[*]
2、配合产品人员完成网页页面的交互/效果/用户体验的实现;[/*]
[*]
3、配合后台工程师一起实现功能和性能需求,进行应用及系统整合;[/*]
[*]
4、优化页面及样式层结构,提高页面响应速度和用户体验;[/*]
[*]
5、保证主流浏览器的兼容性。[/*]
[*]
6、静态html页面的制作、js交互的实现[/*]
[*]
7、用jquery,bootstrap制作网页[/*]
[/list]

对于这样的简历,我很难做一个准确的评估,首先这种简历无法评判出前端的水平,太过普通。其次,我不能说jquery,bootstrap过时了,而是在当今的前端开发中,毫无模式的直接操作DOM并不是一个明智之举。在面试当中,我更看中的是应聘者对前端流露出的喜爱之情,对知识的求知欲,对基础知识的扎实(例如:js里事件的冒泡与捕获,闭包,原型链机制,布局当中的BFC,垂直居中等一系列实践的问题)。对于那些简历里写到掌握最新前端技术的应聘者(例如:babel,webpack,es6,react等),我会问一些react的优化,模块加载的方式,nodejs原理性基础等一些问题。在面试中我发现,有一大部分人,只盲目的学习了这部分工具、框架的用法,却在基础知识方面存在非常多的漏洞。
 
最后我想分析一下转行到前端的人,你应该具备的哪些素质:
 


  • 如果web的任何一个元素(web界面,灵活的编程风格等)有一点吸引了你,让你着实着迷,恭喜你,有了一个完美的开始。确认一下自己是否喜欢和合适前端,而不是为了一份看起来体面而且薪水不菲的工作。


  • 不断学习,每日的积累,关注前端动态,是你跟上前端潮流的主要途径。前端的体系过于庞大,技术框架争涌而出,如果你经常抱怨累死码农的节奏,那就审视一下自己对前端的态度。


  • 主抓基础,避免盲目。前端领域知识点很多,值得学的东西也很多,聪明的人懂得花时间学习成体系的知识并且研究得足够深入,而不是盲目的看到别人用什么框架就去学什么。只停留在实践运用的阶段,到头来框架们都一个一个被淘汰,你仍在原地踏步。


  • 整理总结,先模仿后创造。将每日的积累做好规整,记录到博客也好,笔记也好。多看看牛人的源代码,等你达到了一定的层次水准,自然会得心应手。


  • 持有一颗造福前端社区的心。写一些有意思的小工具、插件,推广出去,


  • 始终坚信,在从事前端的道路上You are not alone。