⚡ TL;DR
- Nó giải quyết gì: Tự động hóa toàn bộ quy trình tạo YouTube Shorts, tweet, và bài affiliate — từ viết kịch bản đến upload, không cần quay hình
- Tại sao quan trọng: Mới chuyển sang Ollama + KittenTTS, chạy hoàn toàn local — không tốn tiền API, không bị giới hạn
- Dùng cho ai: Người muốn đăng nội dung đều đặn trên YouTube Shorts hoặc Twitter mà không cần ngồi trước camera
- Khác biệt chính: Không phải thư viện hay SDK. Là một pipeline hoàn chỉnh — từ sinh kịch bản đến upload — có luôn CRON scheduling
- Ví dụ sử dụng: Chạy một lệnh, chọn chủ đề, đi pha cà phê. Ba mươi phút sau có một YouTube Short trên kênh với hình AI, giọng AI, và nhạc nền
MoneyPrinterV2: 18.000 Sao GitHub Và Cái Máy In Nội Dung
Cái Video 47.000 Views
Hôm trước lướt YouTube Shorts, tôi dừng ở một video về “5 thói quen của người thành công.” Hình sắc nét nhưng generic kiểu stock photo AI. Giọng đọc rõ ràng nhưng không có hơi thở, không có lúc nào người đó ngập ngừng hay nuốt nước bọt. Kịch bản bốn câu, mỗi câu nghe có lý nhưng gộp lại thì chẳng nói gì.
47.000 views.
Tôi tự hỏi ai làm cái này. Không phải vì nó hay. Vì nó có 47.000 views mà rõ ràng không ai ngồi xuống nghĩ về nó quá 5 phút.
Câu trả lời, hóa ra, là một cái repo Python tên MoneyPrinterV2.
Dây Chuyền Trong Ga-ra
Hình dung một dây chuyền sản xuất trong ga-ra nhà bạn. Năm trạm, mỗi trạm làm một việc.
Trạm một: Ollama viết kịch bản. Bốn câu. Đây là số mặc định — bạn đọc đúng rồi, bốn câu.
Trạm hai: KittenTTS đọc kịch bản thành giọng nói. Tám giọng để chọn — Bella, Jasper, Luna, Bruno, Rosie, Hugo, Kiki, Leo. Nghe như người thật nếu bạn không nghe kỹ. Nghe kỹ thì không.
Trạm ba: Gemini vẽ hình minh họa. Tỉ lệ 9:16, chuẩn Shorts.
Trạm bốn: MoviePy ghép giọng, hình, và nhạc nền thành video.
Trạm năm: Firefox mở YouTube, đăng nhập bằng profile có sẵn, upload.
Không trạm nào biết trạm kia đang làm gì. Không trạm nào hỏi video có hay không. Dây chuyền không có ý kiến. Dây chuyền có throughput.
| |
18.000 người star cái này. Một con số đủ lớn để tôi tò mò: họ star vì tên “MoneyPrinter” hay vì nó thực sự in được tiền?
Cái Gì Chạy Local, Cái Gì Không
Ba tuần trước, repo có một thay đổi lớn mà ít người để ý.
Trước đó, muốn chạy MoneyPrinterV2 bạn cần API key cho LLM (GPT hoặc tương đương) và dịch vụ text-to-speech trên cloud. Mỗi video tốn tiền. Cái “máy in tiền” tiêu tiền để in tiền — đó là mô hình kinh doanh, nhưng không phải cái tên gợi ý.
Giờ thì khác:
| |
Ollama chạy local. KittenTTS chạy local. Văn bản và giọng nói: miễn phí.
Chỉ còn Gemini cho hình ảnh là cần API key — nhưng free tier vẫn đủ dùng cho mấy video một ngày.
Rào cản giờ không phải “tôi cần mấy cái subscription” mà là “tôi cần một cái máy tính tạm được và một Gemini API key.”
Đó là lý do 18.000 sao. Không phải vì nó tốt. Vì nó miễn phí và nó chạy.
Thử Thì Biết
Chạy lần đầu khá đơn giản:
| |
Menu hiện lên:
| |
Chọn 1. Tạo account YouTube (thực ra là nhập path đến Firefox profile đã đăng nhập sẵn). Chọn “Generate Video.” Ollama nghĩ vài giây. KittenTTS đọc. Gemini vẽ. MoviePy ghép. Xong.
Video dài khoảng 30 giây. Bốn câu. Hình AI. Giọng AI. Nhạc nền. Upload.
Tổng thời gian tôi ngồi trước máy: dưới 5 phút. Phần còn lại là chờ.
Nếu muốn chạy tự động, CRON scheduling có sẵn — một lần một ngày, hai lần, hoặc ba lần. Bạn set rồi đi ngủ. Sáng dậy có video mới trên kênh.
Twitter bot cũng tương tự. Ollama viết tweet về topic bạn cấu hình. Firefox post. Schedule tuỳ ý.
Cái Mà Nó Không Làm
Affiliate marketing: scrape trang Amazon, Ollama viết pitch, post lên Twitter. Đơn giản và hiệu quả nếu bạn có sản phẩm phù hợp.
Outreach: scrape Google Maps tìm doanh nghiệp địa phương, gửi cold email qua SMTP. Đây là lúc tool ngừng cảm giác như “content automation” và bắt đầu cảm giác như thứ mà spam folder của bạn biết rõ.
Cái nó không làm: không có analytics. Không có A/B testing. Không có feedback loop từ lượt xem ngược lại script generation. Không có cái gì đánh giá chất lượng nội dung.
Dây chuyền sản xuất rồi xuất xưởng. Chuyện gì xảy ra sau đó, bạn tự lo.
Bốn Câu
Bốn câu. Đó là script_sentence_length mặc định trong config.json.
Bạn có thể tăng. Nhưng số mặc định nói rất nhiều về đối tượng sử dụng. Người dùng MoneyPrinterV2 không tìm chất lượng nội dung. Họ tìm khối lượng.
Và YouTube Shorts, ở một mức độ nào đó, thưởng cho khối lượng.
À, còn cái is_for_kids flag trong config. Mặc định false. Nghĩa là ai đó đã nghĩ đến chuyện bật nó lên true. AI viết kịch bản, AI đọc, AI vẽ hình — cho trẻ em xem. Tôi không biết nên cười hay lo.
Firefox Và Sự Mong Manh
Phần thông minh nhất của MoneyPrinterV2 cũng là phần dễ vỡ nhất.
Upload video lên YouTube không qua API. Không qua OAuth. Nó mở Firefox, dùng profile đã đăng nhập sẵn, rồi điều khiển trình duyệt click từng nút upload.
Thông minh vì không cần YouTube API key (cái mà Google khó cho). Dễ vỡ vì YouTube đổi UI thường xuyên. Một lần đổi nút, bot vỡ.
Repo có 19 issues mở. Một số là về chính chuyện này.
Twitter cũng vậy. Không dùng API. Dùng Firefox. Cùng rủi ro.
Dây Chuyền, Nhìn Lại
MoneyPrinterV2 không phải chiến lược nội dung. Nó là băng chuyền.
Nó sẽ đáng tin cậy sản xuất video, tweet, và pitch từ nguyên liệu bạn cho — một từ khoá chủ đề, một link sản phẩm, một topic. Chất lượng đầu ra phụ thuộc hoàn toàn vào đầu vào và mức độ bạn sẵn sàng can thiệp.
Bốn câu từ model 3 tỷ tham số. Giọng AI. Hình AI. Đó là sản phẩm mặc định.
License AGPL-3.0, nên nếu bạn sửa code rồi deploy thành dịch vụ, bạn phải open-source phần sửa đổi.
18.000 người star. Một số người đang kiếm tiền với nó. Dây chuyền chạy.
Còn cái video 47.000 views kia — tôi vẫn không biết nó nói gì. Bốn câu, không nhớ câu nào.
→ github.com/FujiwaraChoki/MoneyPrinterV2
Đọc thêm
- Superpowers: Quy Trình Dạy Agents AI Thành Người Kỉ Luật — Nếu MoneyPrinterV2 tự động hóa output, Superpowers tự động hóa judgment. Triết lý khác, cùng thời đại.
- DeerFlow: Multi-Agent Research Thực Sự Hoạt Động — Một cách khác để chain AI agents, lần này cho nghiên cứu thay vì nội dung.
