1.数据库(Database)——是按照数据结构来组织、储存和管理数据的仓库。它利用数据库中的各种对象,记录、处理和分析各种数据。
随着现代社会进入信息时代,我们每天的工作和生活都离不开各种信息。对这样的海量数据这时就需要采用数据库对其进行有效的存储与管理,并运用数据库进行合理的处理与会忻,使其转化为有价值的数据信息。、
2、一个通用数据库具有以下几项基本功能。
(1).向数据库中添加新数据记录,例如增加用户信息。
(2).编辑数据库中的现有数据,例如修改某个用户信息。
(3)、删除数据库中的信息记录,例如删除失去时效性的数据,以释放储存空间。
(4)、以不同方式组织和查看数据,例如对数据进行查询、处理与分析。
常用的数据库有Oracle、M icrosoft SQL Server、MySQL、Micro8o0 Access等关系型数据
库,随着大数据时代的到来,相关的数据库技术也快速发展,如基于NoSAL技术的分布式数据
库 Hbase. MongoDB. Redis 等.
3、Access数据库
Access数据库是MicrosoftOffice办公软件中一个极为重要的组成部分,是一种关系数据库管理系统软件,它能够帮助用户处理各种海量信息,不仅能存储数据,更重要的是还能够对数据进行处理和分析,数据处理功能比Excel更胜一筹。由于目前Access 2010为较为常用版本,所以我们将基于Access 2010来学习数据处理和分析(如图所示)。
如图所示
下面我们就学习用Access201o:进行数据处理与分析,用到的主要对象是表和查询
(1)表
作为一个数据库,最基本的组成单位就是表。建立和规划数据库,首先要做的就是建立各科
数据表,数据表是数据库中存储数据的唯一单位,数据库将各种信息分门别类地存放在各种数据
表中,例如专户信息表、订单表、采购表等。
( 2). 查询
查询是数据库中应用最多的对象之一,可执行很多不同的功能,最常用的功能是根据指定条件从表中检索数据。
查询和表的区别在于,查询中的所有数据都不是真正单独存在的。查询实际上是一个固定的筛选,它根据指定条件将表中的数据筛选出来,并以表的形式返回筛选结果。
在Access数据库中我们就是采用查询方式进行数据处理与分析的。
4、优势和不足
为什么用Access数据库,而不用Oracle、Microsoft sQL Server等数据
因为Access数据库与0racle等其他关系型数据库相比具有以下两大优势
(1)Access与Excel、powerpoint、word都是微软Office产品,只要熟悉Excel、Powerpoint.
Word中的任二款软件,即使没有数据库经验,对Access也能快速上手。Access风格与Windowp
完全一样,用户想要生成对象并应用,只要使用鼠标进行拖放即可,非常直观方便。
Office办公软件的一部分,Access可以与Office其他软件集成,实现无线连接。
(2)Access查询处理可直接生成相应的SQL语句
通过Access查询向导设置好需要的表关联及查询条件,单击。SQL视图。,即可获取相应的SQL语句,无须重新编写。在此基础上,还可以进行简单的调整、优化,即可转化为所需的SQL
语句,方便快捷。
有优势,自然也有不足,Access是小型数据库,与Orac\e等其他关系型数据库相比存在以下不足。
数据库过大时(一般Access数据库文件百兆以上),其性能会变差。
记录数过多时(一般记录数达到千万条以上),其性能会变差。
Access数据库中每个数据库文件上限为2GB.
虽然Access数据库存在以上三大不足,但并不妨碍我们使用它完成日常工作与学习任务,
因为用它学习SQL处理数据真的很方便,不需要写SQL语句。只要数据记录不起亿条,其处理速度
还是可以接受的,数据记录越少,其处理速度就越快。
5.万能的SQL
刚才提到了好几次SQL,什么是SQL呀·?
SQL(Structured Query Language)是结构化查询语言,它是一种通用的关系型数据库操作语言。简单来说,它就是让数据库按我们的意思来实现查询操作的语言。
说到这里,小白灵机二动我可不可以这样理解:SQL就好比动画片《葫芦娃兄弟》里那个
女妖精手中的宝贝——如意,如意、如意,按我心意,快快显灵·····。
由于SQL功能丰富强大,语言简洁易学,使用方法灵活,目前所有主要的关系数据库管理系统都支持SQL.
虽然Access数据库大部分查询都可通过菜单完成,不需要用到SQL语句,但是如果想真正利用Access数据库强大的数据处理、分析能力,那么掌握SQL是非常必要的。
作为一名优秀的数据分析师,只有亲自经历在数据库中处理与分析数据的过程,才能对分析结果有更深层次的认识,同时也会加深对业务的理解,否则看到的只是一个个数字,并不能体会其内涵。
另外,业内人士常说的数据挖掘,很多是通过对历史数据进行建模预测,生成一定的规则,然后数据库工程师将生成的规则编写成相应的SQL语句,并编写成数据库的存储过程,可定期执行它们得到数据模型结果。最后,处理大数据的Hadoop,所使用的Hive语言(HQL),也是与SQL语言基本一致,只不过部分语句的编写或功能存在差异。掌握了SQL,再学习HQL就非常容易了。
联系客服