Scarlett Huang | Blog


  • Home

  • Categories

  • know me

  • Archives

  • Tags

  • Search

统计数据分析|SPSS操作学习笔记

Posted on 2018-04-25 | In Computer Science , Data Mining and Analysis |

Abstract:灰常全面的SPSS 学习笔记 ~

// 最近传播统计学课程要进行 SPSS 实操了 w

Read more »

Python Numpy 矩阵运算(附实例和学习材料)

Posted on 2018-04-20 | In Computer Science , Data Mining and Analysis |

Abstract:使用numpy进行矩阵的加减乘除、转置、求逆、求特征向量等运算。

Read more »

我的AI PM实习面经(腾讯AILAB,商汤,旷视,网易)

Posted on 2018-04-16 | In Artificial Intelligence , AI PM |

Abstract:2018年3~4月找AI PM暑期实习和面试经验总结 ~ 大概花了1~2周,面了几家公司,拿了商汤和旷视的AI PM实习offer(开心辣)

Read more »

NLP|中文分词技术及应用

Posted on 2018-04-15 | In Artificial Intelligence , Natural Language Processing |

摘要:中文分词是中文信息处理的重要基础,本文详细阐述了目前主要的几种中文分词算法的技术原理 、中文分词目前的瓶颈和评价准则,以及中文分词的具体应用。

中文分词指将一个汉字序列切分成一个个单独的词。现有的中文分词算法有五大类:基于词典的方法,基于统计的方法,基于规则的方法,基于字标注的方法,基于人工智能技术(基于理解)的方法。中文分词目前主要有四个瓶颈,分别是分词歧义、未登录词识别、分词粒度问题、错别字和谐音字规范化。中文分词有五大评价准则:分词正确率,切分速度,功能完备性,易扩充性和可维护性,可移植性。中文信息处理包括三个层次:词法分析,句法分析,语义分析,其中中文分词是词法分析的第一步,非常重要。中文分词是大部分下游应用的基础,这些下游应用小到POS词性标注、NER命名实体识别,大到自动分类、自动摘要、自动校对、语言模型、机器翻译、搜索引擎、语音合成等等。

Read more »

算法推荐带来的“信息茧房”效应研究

Posted on 2018-04-12 | In Artificial Intelligence , Recommended System |

摘要:本文基于桑斯坦的“信息茧房”理论,以今日头条为实例,研究新媒体时代下算法推荐带来的“信息茧房”效应。在此基础上剖析了今日头条的“信息茧房”效应的具体成因以及危害,并给出规避这种危害的建议。

Read more »

ofo产品分析|共享单车为何能快速成长

Posted on 2018-04-08 | In Product Manager , Internet & Product |

摘要:本文以产品的角度观ofo全局,从产品本身、用户需求、产品解决方案、产品运营、商业模式、未来发展策略六个维度去分析以ofo为代表的共享单车得以快速成长背后的原因。

Read more »

解析TF-IDF算法原理:关键词提取,自动摘要,文本相似度计算

Posted on 2018-04-05 | In Artificial Intelligence , Natural Language Processing |

Abstract:TF-IDF算法是一种常用的词频统计方法,常被用于关键词提取、文本摘要、文章相似度计算等。

Read more »

传播统计学作业2|广告效果比较检验

Posted on 2018-03-26 | In Computer Science , Data Mining and Analysis |

Abstract:两道传播统计学的作业题,关于广告测试效果比较检验。

Read more »

解析今日头条的内容推荐服务

Posted on 2018-03-25 | In Artificial Intelligence , Recommended System |

Abstract:今日头条以推荐算法为引擎在内容领域表现强劲,且其产品从单纯的新闻客户端演变成较大的产品矩阵,内容结构不断完善,可见头条正向综合性信息媒体平台方向发展,甚至其可能更大的野心是做未来互联网的入口。不过,从前坚持“算法至上”的头条,在经历被人民网点名批评和“约谈”后开始采取多项举措力图解决其平台上色情低俗内容泛滥的问题。至于这些举措的效果如何,且待时间检验。

Read more »

今日头条推荐算法原理解析

Posted on 2018-03-25 | In Artificial Intelligence , Recommended System |

Abstract:这篇是1月份头条首次公开的算法原理的阅读笔记。

Read more »

MyProducts2017

Posted on 2018-03-23 | In Artificial Intelligence , AI PM |

Abstract:我在2017年的产品作品集。

Read more »

C++求平方根和立方根中遇到的问题

Posted on 2018-03-21 | In Computer Science , C/C++ |

Abstract: C++求平方根和立方根中遇到的问题: 函数参数不能为负数,否则会输出Nan。

Read more »

如何在Github上托管和预览静态网站?

Posted on 2018-03-19 | In Computer Science , Coding |

Abstract:如何把网站托管在GitHub上并能实时预览?本文是Solution ~

Read more »

给毛爷爷做了1个个人简历网站

Posted on 2018-03-19 | In Computer Science , Coding |

Abstract:其实是某通识课的课后作业,要求给毛爷爷做一份简历。我想与其做纸质的,不如为毛爷爷设计一个网站,这样更有趣 ~

Read more »

传播统计学作业1|统计学基础概念

Posted on 2018-03-17 | In Computer Science , Data Mining and Analysis |

Abstract:10道传播统计学的作业题,主要关于传播统计学基础概念。参考教材是祝建华所著的《传播统计学》。

Read more »
123…13
Scarlett Huang

Scarlett Huang

192 posts
35 categories
62 tags
Biography Github WoShiPM
Friend Links
  • Unique-AILab
  • MR WHY (ML Dev. & AI PM)
  • Zekang Li (NLP Researcher)
  • Vic Chan (CV Dev.)
  • qzwlecr (Alg. Dev.)
  • Alisa (Alg. Dev.)
  • yifan (Android Dev.)
<%- partial('totop') %>
© 2017 — 2019 Scarlett Huang
共597.8k字
本站总访问量次
本站访客数人次